AI ექსპერტები ყველაზე რთულ კითხვებს აგროვებენ, რათა ხელოვნური ინტელექტის (AI) უძლიერესი სისტემები გამოცადონ. გამოცდის ორგანიზატორებს უზარმაზარი სიის შექმნა სურთ, შიგნით შესატან კითხვებს კი სხვადასხვა სფეროში მოღვაწე ხალხისგან ელიან.

Reuters-ის უწყებით, ტესტისთვის კითხვებს AI-ს უსაფრთხოების ცენტრი (CAIS) აგროვებს ფირმა Scale AI-სთან ერთად. ტესტს "კაცობრიობის ბოლო გამოცდას" უწოდებენ.

ამ "გამოცდისთვის" კითხვების მიღება მას შემდეგ მალევე დაიწყეს, რაც OpenAI-მ o1 მოდელის წინასწარი ვერსია გამოუშვა. CAIS-ის აღმასრულებელი დირექტორის, დენ ჰენდრიკსის, თქმით, o1-მა, როგორც ჩანს, აზროვნების ყველაზე პოპულარულ სტანდარტებს გადააჭარბა.

ასევე იხილეთ: გავრცელებული ინფორმაციით, OpenAI ახალ მოდელზე მუშაობს, რომელსაც "ადამიანის მსგავსი მსჯელობა" შეეძლება

2021 წელს ჰენდრიკსმა კოლეგებთან ერთად ორი ნაშრომი დაწერა, რომლებშიც AI-ს ტესტირება იყო შემოთავაზებული. გამოცდის მიზანი იმის შეფასება იყო, დაამარცხებდა თუ არა ხელოვნური ინტელექტის მოდელები სტუდენტებს. ამ დროს შემოწმებული AI სისტემები პასუხებს თითქმის შემთხვევითად იძლეოდა, თუმცა, ჰენდრიკსის თქმით, დღევანდელმა მოდელებმა 2021-ის ტესტები "გაანადგურა".

ამ ტესტების კრიტერიუმები სისტემებს მათემატიკასა და სოციალურ კვლევებში ამოწმებდა. მეორე მხრივ, "კაცობრიობის ბოლო გამოცდაში" სირთულისთვის აბსტრაქტული აზროვნებაც შევა. ორგანიზატორები ტესტის კრიტერიუმებს არ გაასაჯაროებენ, რათა პასუხები შემთხვევით AI-ს საწვრთნელ მონაცემებში არ აღმოჩნდეს.

///

1-ელი ნოემბრისთვის სხვადასხვა დარგის ექსპერტებმა, ფილოსოფია იქნება ეს თუ რაკეტათმშენებლობა, ისეთი კითხვები უნდა გაგზავნონ, რომლებზე პასუხიც სფეროს არმცოდნე ადამიანებს გაუჭირდებათ. ორგანიზატორები კითხვებს მიმოიხილავენ და შეარჩევენ, გამარჯვებულებს კი ტესტთან დაკავშირებული ნაშრომის თანაავტორობას შესთავაზებენ. Scale AI პროზებსაც გასცემს $5 000-ამდე.

ორგანიზატორები სხვადასხვა ტიპის უამრავ შეკითხვას ცდიან, თუმცა Reuters-ის კორესპონდენტებს უთხრეს, რომ გამოცდაში იარაღების შესახებ არაფერი არ შევა — მათი აზრით, AI-ს მხრიდან ამის ცოდნა ზედმეტად სახიფათოა.

თუ სტატიაში განხილული თემა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ტექნოლოგიებზე.