ხელოვნურმა ინტელექტმა ადამიანი კიდევ ერთ სამაგიდო თამაშში დაჯაბნა — როგორ
ხელოვნურმა ინტელექტმა 40 თამაშში მიიღო მონაწილეობა, საუკეთესო 10%-ში შევიდა და ვერავინ მიხვდა, რომ ის ადამიანი არ იყო.
ნარდი მარტივი გამარჯვება იყო, ჭადრაკი – ცოტა უფრო რთული, გო – უფრო ძნელი. სამაგიდო თამაშების მრავალი მოყვარულისათვის ხელოვნური ინტელექტი ახლა უკვე ნამდვილად შეუერთდა მოთამაშეთა კლუბს — AI-მა დაამტკიცა, რომ ცნობილ სამაგიდო თამაშ Diplomacy-ში ადამიანის დამარცხება შეუძლია.
მათთვის, ვინც ამ თამაშს არ იცნობს, პრინციპს ავხსნით. მისი სათამაშო "დაფა" ევროპის რუკაა პირველ მსოფლიო ომამდე. საუკეთესო შემთხვევაში, 7 მონაწილე ინაწილებს 7 დიდ სახელმწიფოს: ავსტრიის იმპერიას, ბრიტანეთს, გერმანიას, იტალიას, რუსეთსა და თურქეთს. თითოეულ მოთამაშეს ჰყავს არმია, ფლოტი და გეოგრაფიულად განლაგებული რესურსები მათ მხარდასაჭერად. ბუნებრივია, სამხედრო ძალები გამოიყენება მეზობელი ტერიტორიების დასაპყრობად, რაც გამარჯვების შანსს ზრდის.
განსაკუთრებით საინტერესო ისაა, რომ დასაწყისში მოწინააღმდეგეები ვერაფერს იზამენ, თუ სხვა მოთამაშეებთან შეთანხმებებს არ დადებენ და მოლაპარაკებებს არ აწარმოებენ. უფრო საინტერესოა, რომ მოთამაშეს ამ შეთანხმებების დაცვა არ მოეთხოვება. ის, თუ ვინ არის რეალური მოკავშირე ან მტერი ირკვევა მაშინ, როცა მოთამაშეები გამოაჩენენ ჯარების გადაადგილების მარშრუტებს.
Cicero, Meta Fundamental ai Research Diplomacy Team-ის მიერ შექმნილი პროგრამა, კარგი მოსწავლე აღმოჩნდა. როგორც გუნდი Science-სთან საუბარში ამბობს, მათ თავიანთი ქმნილება Diplomacy-ის ონლაინ ლიგაში შეუშვეს, სადაც 40 თამაშში მიიღო მონაწილეობა. პროგრამა საუკეთესო 10%-ში შევიდა და ვერავინ მიხვდა, რომ ის ადამიანი არ იყო.
წარსულის ყველა AI მოთამაშე პროექტი ახალი გამოცდილების მეთოდით სწავლობდა. საკუთარ თავთან განმეორებითი თამაშისას ხელოვნური ინტელექტი თავდაპირველად შემთხვევითობის პრინციპით მოქმედებს, შემდეგ შერჩევით. საბოლოოდ, ის სწავლობს, როგორ მიაღწიოს დასახულ მიზანს. Cicero-ც სწორეთ ამ მეთოდით განვითარდა, თუმცა ეს არ არის წვრთნის ერთადერთი გზა, რომელიც ამ პროგრამამ გაიარა. სწორი სტრატეგიის გარდა, Diplomacy-ში გასამარჯვებლად მოთამაშეს საკომუნიკაციო უნარებიც სჭირდება.
Meta-ს გუნდის მნიშვნელოვანი კონტრიბუცია გამოცდილების მეთოდისათვის ბუნებრივი ენის (natural-language processing) დასწავლის დამატება იყო. დიდი ენობრივ მოდელებს, რომლებიც მონაცემთა დიდ რაოდენობას იყენებენ, აქვთ ადამიანური საუბრის იმიტირების შესაძლებლობა. Cicero-ს შემთხვევაში, გამოყენებული იყო 40000 თამაში, რათა ხელოვნურ ინტელექტს Diplomacy-სთვის დამახასიათებელი ტერმინოლოგია შეეთვისებინა.
Cicero აკვირდება დაფას, იმახსოვრებს წინა სვლებს და ვარაუდობს, რომელ მოთამაშეს რისი გაკეთება შეიძლება სურდეს. შემდეგ ის ცდილობს გამოითვალოს თავისი საუკეთესო სვლა, შეაფასოს სტრატეგია, დასახოს მიზნები, მათი შედეგი და ივარაუდოს, თუ როგორ იმოქმედებენ მოთამაშეები მისი სტრატეგიის წინააღმდეგ.
როცა სვლას მოიფიქრებს, Cicero არჩევს ტერმინოლოგიას, რომლითაც მოთამაშეებს დაეკონტაქტება. ის არჩევს სიტყვებსა და ფრაზებს, რომლებიც, მისი შეფასებით, ყველაზე მეტად დაარწმუნებს მოწინააღმდეგეებს. გამოცდილ ბორდ გეიმ გიკებს, ალბათ, ყველაზე მეტად ის აინტერესებთ, შეუძლია თუ არა Cicero-ს ზურგში მახვილის ჩარტყმა. მიუხედავად იმისა, რომ ხელოვნური ინტელექტი თამაშის მომენტში სტრატეგიულად იღებს ინფორმაციას მოწინააღმდეგეებისგან, არც ერთ შემთხვევაში "ღალატის" ფაქტი არ დაფიქსირებულა, რაც Diplomacy-ის მოყვარულებს დამშვიდების საფუძველს გვაძლევს, ვინაიდან ეს თამაშის ერთ-ერთი მნიშვნელოვანი ასპექტია.
სავარაუდოდ მაკიაველური დაუნდობლობის არარსებობა ხსნის ფაქტს, რომ პროგრამა საუკეთესო 10%-ში შევიდა და აბსოლუტური გამარჯვებული ვერ გახდა.
კომენტარები