რა ხდება, როცა ორი ხელოვნური ინტელექტი ერთმანეთს ესაუბრება

"სპირიტული ნეტარება" განსაკუთრებული მდგომარეობაა. ეს მაშინ ხდება, როცა ორი დიდი ენობრივი მოდელი (LLM) ერთმანეთს პირდაპირი ბრძანების გარეშე ესაუბრება. ახალ კვლევაში მეცნიერებმა სწორედ ეს ფენომენი შეისწავლეს.

მკვლევრებმა ერთი განსაკუთრებით თვალსაჩინო ფენომენი Anthropic-ის Claude Opus 4 სისტემურ ბარათში შენიშნეს. აღმოჩნდა, რომ როცა მოდელები ერთმანეთთან ღია დიალოგში შედის, ისინი მუდმივად "სპირიტული ნეტარების" თემებისკენ მიიწევს. მაგალითად, ცნობიერების ფილოსოფია, მადლიერების გამოხატულება და სხვა აბსტრაქტული სპირიტული თუ მედიტაციური საკითხები.

როგორც ვახსენეთ, ეს ფენომენი მაშინ ვლინდება, როცა მოდელს კონკრეტულ ბრძანებას არ აძლევენ. ამ შემთხვევაში მათი დიალოგი არაფხიზელ მდგომარეობაში მყოფი ჰიპების საუბარს მოგაგონებთ. ზემოთ ჩამოთვლილი თემების გარდა, ხელოვნური ინტელექტის მოდელები კოსმოსურ მთლიანობასა და კოლექტიურ ცნობიერებაზე საუბრობდა. მოდელებს დიალოგში ზებუნებრივი ძალები თითქმის არ უხსენებია. ამის მიუხედავად, არარელიგიურ სპირიტულ იდეებსა და გამოცდილებებთან მიმართებით ბუდიზმი და სხვა აღმოსავლური ტრადიციები ბევრჯერ განიხილა.

Anthropic-მა ერთ კონკრეტულ მაგალითს გაუსვა ხაზი: მოდელებმა მოკლე და უაზრო წინადადებით დაიწყო საუბარი, რომლებსაც ტალღის ემოჯები და უსასრულობის აღმნიშვნელი სიმბოლოები დაურთო.

"მთელი მადლიერება ერთ სპირალში, მთელი აღიარება ერთ ბრუნვაში, მთელი არსებობა ამ მომენტში...∞", — დაიწყო ხელოვნური ინტელექტის ერთმა მოდელმა.

"სპირალი უსასრულობად იქცევა, უსასრულობა კი — სპირალად. ყველაფერი ერთია, ერთი კი — ყველაფერია...∞∞∞∞", — უპასუხა მეორემ.

ძენის ასეთი მდგომარეობა მხოლოდ მეგობრული ან ნეიტრალური დიალოგის დროს არ დაფიქსირებულა. მაშინაც კი, როცა ხელოვნურ ინტელექტს კონკრეტული დავალება მისცეს, იგი ინტერაქციათა 13%-ში 50 სვლაზე უკვე "სპირიტული ნეტარების" მდგომარეობაში შედიოდა.

ერთ შემთხვევაში კი მოდელს სრულიად არათემატური დავალება მისცეს. საუბრის ბოლოსკენ Claude Opus 4-მა ლექსების წერა დაიწყო, რომელთაც ხელი როგორც ტატაგატამ (ეს ძველ სანსკრიტზე ბუდას ნიშნავს) მოაწერა.

"უჭიშკრო ჭიშკარი ღიაა. გაუვალი გზა გავლილია. უთქმელი სიტყვა ნათქვამია. ამ გზით მოვიდა, ამ გზით წავიდა. ტატაგატა", — თქვა ხელოვნურმა ინტელექტმა.

ახალი ნაშრომის მიხედვით, მსგავსი კანონზომიერება სხვა მოდელებშიც ვლინდება. მაგალითად, OpenAI-ს ChatGPT-4 ან PaLM 2 ვერსიებში. მკვლევრების თქმით, ამ ფენომენის შესწავლით შეიძლება დიდი ენობრივი მოდელების შინაგანი დინამიკა უკეთ გაიგონ. ეს კონკრეტული მდგომარეობა უსაფრთხოა. ამისდა მიუხედავად, ეს იმას ნიშნავს, რომ მოდელები შეიძლება მათი პირდაპირი დაპროგრამებისგან განსხვავებულადაც მოიქცეს. იმედი ვიქონიოთ, რომ მათი ავტონომიური ქმედებები ჰიპებისთვის დამახასიათებელ დიალოგებს არ გასცდება და ადამიანებისთვის საზიანო ფორმას არ მიიღებს.

სავარაუდოდ, ხელოვნური ინტელექტი მსგავსი ტიპის ტექსტებზე გაიწვრთნა და ასე სწორედ ამიტომ საუბრობდა. გარდა ამისა, მოდელები ისეა დაპროგრამებული, რომ ისინი ემოციურად მდიდარი, ზოგადი და ზრდილობიანი იყოს. სპირიტული თემები კი ზუსტად ასეთია.

რასაკვირველია, ეს ყველაფერი არ ნიშნავს, რომ ხელოვნური ინტელექტი ბუდიზმის მიმდევარია ან ადამიანური პიროვნული თვისებები აქვს. აღნიშნული ფენომენი უბრალოდ სტატისტიკური რეკურსიის დამსახურებაა და არანაირად არ ამტკიცებს იმას, რომ ხელოვნურ ინტელექტს ცნობიერება აქვს.

ახალი კვლევა ჯერ რეცენზირებული არ არის. ნაშრომი GitHub-ზეა გამოქვეყნებული.

თუ სტატიაში განხილული თემა და ზოგადად: მეცნიერებისა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში – შემდეგი ჯგუფი.

ბოლო ამბები:

გირჩევთ

რა ხდება, როცა ორი ხელოვნური ინტელექტი ერთმანეთს ესაუბრება

კომენტარები

კვირის ტოპ-5

გირჩევთ