კანალიზაციის ჭა, თუ მაგიდაზე მჯდომი ციცინათელა? მწვანე იგუანა, თუ ციყვი? ადამიანებისთვის ამ კითხვებზე პასუხი ცხადია, თუმცა მსოფლიოში არსებულ ყველაზე მაღალგანვითარებულ ხელოვნურ ინტელექტს წარმოდგენაც არ აქვს, თუ რა ჩანს ამ ფოტოებზე.

ამის მიზეზი ისაა, რომ ეს ფოტოები ხელოვნური ინტელექტის დასაბნევად სპეციალურადაა შერჩეული, ისინი კალიფორნიის უნივერსიტეტის, ვაშინგტონის უნივერსიტეტისა და ჩიკაგოს უნივერსიტეტის მეცნიერების მიერ შეგროვებული 7 000 ფოტოს შემცველი ბაზიდანაა აღებული.

"მანქანური დასწავლის ამჟამინდელი მოდელები ძალიან ფაქიზია. სხვა მეცნიერები AI-ს სანდოობის შესამოწმებლად ხელოვნურ ინფორმაციას იყენებენ, ჩვენ კი ვახდენთ იმის ილუსტრაციას, რომ ხელოვნური ინტელექტი რეალური ინფორმაციის (ამ შემთხვევაში, ნამდვილი ფოტოების) დამუშავებისას აბსურდულ შეცდომებს უშვებს", — აცხადებს კალიფორნიის უნივერსიტეტის დოქტორანტურის სტუდენტი და კვლევის ავტორი დენ ჰენდრიკსი.

ფოტო: Dan Hendrycks

რატომაა ეს მნიშვნელოვანი?

ბოლო რამდენიმე წლის განმავლობაში ფოტოების ამოცნობის ალგორითმები ძალიან სწრაფად დაიხვეწა. ეს დიდწილად სტენფორდის უნივერსიტეტის მიერ შექმნილი მონაცემთა ბაზის, ImageNet-ის წყალობით მოხდა, რომელშიც 14 მილიონი ანოტირებული ფოტოა.

სწორედ ამ უზარმაზარ მონაცემთა ბაზაზე დაყრდნობით "წრთვნიან" მეცნიერები ხელოვნურ ინტელექტს. ამის საშუალებით, მაგალითად, Microsoft-ის Bing-ს წარმატებით შეუძლია ამოიცნოს, თუ რა ჩანს ფოტოების 95 პროცენტში. ეს მაჩვენებელი საკმაოდ მაღალია და ხშირად AI ადამიანებსაც კი სჯობნის.

თუმცა დარჩენილი 5 პროცენტი უდიდესი პრობლემაა. 2017 წლის შემდეგ ფოტოების ამომცნობი ალგორითმები პრაქტიკულად ვეღარ უმჯობესდება. სწორედ ამიტომ ცდილობენ მეცნიერები, რომ შეისწავლონ და გააანალიზონ ის ფოტოები, რომელთა ამოცნობასაც კომპიუტერები ვერ ახერხებენ.

კვლევისას მეცნიერებმა Flickr-იდან ის ფოტოები, რომლებიც მათი აზრით ხელოვნურ ინტელექტს დააბნევდა, ხელით ამოარჩიეს. შემდეგ კი მათ ImageNet-ზე გაწრთვნილ AI-ზე ტესტავდნენ — თუ ალგორითმი ფოტოს ამოცნობას ვერ მოახერხებდა, მას ახალ მონაცემთა ბაზაში, ImageNet-A-ში აგდებდნენ, რაც, რეალურად, ImageNet-ის საპირისპირო ბაზაა.

საბოლოოდ კი 7 000 ფოტო შეგროვდა. AI-ს მიერ ამ ფოტოების ამოცნობის სიზუსტე 90 პროცენტიდან ორ პროცენტამდე დავარდა. ანუ ამ ბაზაში 100-დან 98-ჯერ ალგორითმი ფოტოს ამოცნობას ვერ ახერხებს.

კითხვაზე, თუ რატომ ვერ ახერხებს AI ამ ფოტოების ამოცნობას, პასუხის პოვნა რთულია. დღეს ხელოვნურ ინტელექტს მხოლოდ მიღებული შედეგის მიხედვით ვაფასებთ, ის პროცესი კი, რომელსაც ალგორითმი შედეგის მისაღებად აწარმოებს, უცნობია. თუ სწავლებისას ალგორითმი ხეების იმდენ ვარიაციას ნახავს, რომ შემდეგ ახალ ფოტოებში ახალი ხეების ამოცნობას შეძლებს, ჩვენ მივიჩნევთ, რომ ალგორითმი წარმატებულია. პრობლემა ისაა, რომ ჩვენ არ ვიცით, რა პრინციპით წყვეტს AI, რომ ხე, ხეა. ფერი? გეომეტრია? კონტექსტი? ამის პასუხი არ გვაქვს. ხელოვნური ინტელექტი მის მიერ მიღებული შედეგებით ფასდება და არა მისი "აზროვნებით."

ამის შედეგად ვიღებთ მიკერძოებულ ალგორითმს, რომელიც რეალურ ცხოვრებაში გამოყენებისას პრობლემებს შექმნის.

ზღვის ლომი.

ზღვის ლომი.

ImageNet-A-ს შექმნის მიზანი იმის გარკვევაა, თუ რატომ ვერ იცნობს ალგორითმი ამ ფოტოებს. მაგალითად, როდესაც AI-ს ციყვი ზღვის ლომში ეშლება, ცხადი ხდება, რომ ამ ალგორითმს აზროვნებასა და ინტელექტთან საერთო არაფერი აქვს. როგორც ჩანს, ამ დროს ალგორითმი მხოლოდ და მხოლოდ ცხოველების ტექსტურას აკვირდება, მათი ზომა და ფორმა კი სრულად უგულებელყოფილია.

"ფოტოები, რომლებშიც ობიექტის ფორმის ამოცნობაა საჭირო, AI-ს ყველაზე ხშირად ატყუებს", — ამბობს ჰენდრიკსი.

თუ ალგორითმს ImageNet-A-ზე გავწრთვნით, გადაჭრის თუ არა ეს პრობლემას? დიდი ალბათობით, არა.

"რეალური სამყარო ძალიან მრავალფეროვანი და კომპლექსურია, ამ მოდელების სწავლება ალგორითმს ყველანაირი ვიზუალური მრავალფეროვნების მქონე ობიექტებისა და საგნების ამოცნობას მაინც ვერ ასწავლის. თუ ერთ ტრილიონ ფოტოს გამოვიყენებთ, შესაძლოა, გარკვეული ხარვეზები აღმოვფხვრათ. მაგრამ რეალურ ცხოვრებაში მუდმივად ვიღებთ ახალ და უნიკალურ სცენარებს, რაც ალგორითმს ისევ დააბნევს", — ამბობს ჰენდრიკსი.

სხვა სიტყვებით რომ ვთქვათ, ამჟამინდელ მონაცემთა ბაზებზე კიდევ უფრო მეტი ფოტოების დამატება და შემდეგ ალგორითმების თავიდან გაწრთვნა, ამ პრობლემას ვერ გადაჭრის. ყოველთვის იქნება ისეთი ფოტოები და ობიექტები, რომელთა საკმარისი რაოდენობაც ალგორითმს არ უნახავს, შესაბამისად, ის მათ ამოცნობას ვერ შეძლებს. ჰენდრიკსის თქმით, ამ პრობლემის გადასაჭრელად ახალი მიდგომების შემუშავებაა საჭირო. ან, შეგვიძლია, მსგავსი მეთოდების არ შევიმუშაოთ და უპირატესობა, რომელიც ადამიანებს მანქანებზე გვაქვს, ცოტა უფრო დიდი ხნით შევინარჩუნოთ.

ამავე თემაზე: