რატომ და როდის აგენერირებს მცდარ პასუხებს ChatGPT-ის ქართული ანალოგი

გუშინ ChatGPT-ის ქართულენოვანი ანალოგი — ჟიპიტაური ამუშავდა, სოციალურ ქსელში კი მისი დატესტვისას მიღებული ტექსტების ამსახველ არაერთ ფოტოს შეხვდებით. მათ შორის არის სქრინები, სადაც ჩატბოტი აშკარად მცდარ ინფორმაციას გვაწვდის. ეს ეხება რუსეთ-საქართველოს ომსა თუ ცნობებს ჩვენი პირადი მიღწევების შესახებ. ჩატბოტთან დიალოგისას მიღებულ მცდარ ინფორმაციაზე საპასუხოდ ჟიპიტაურის შემქმნელმა კომპანია Supernova-მ საიტზე ჩანართის სახით გაფრთხილება განათავსა:

"ეს არის ავტომატიზირებული სისტემა, რომელიც იყენებს open ai-ს მიერ შექმნილ ენობრივ მოდელს, რომელმაც შეიძლება დააგენერიროს ისეთი ტექსტი, რომელიც არ ეფუძნება ფაქტებს და არ წარმოადგენს სიმართლეს. ჩვენ არ ვიღებთ პასუხისმგებლობას ამ ინფორმაციის სრულყოფილებასა და სისწორეზე".

კითხვას: რატომ აგენერირებს მცდარ ინფორმაციას ChatGPT-ის ქართული ანალოგი ლოგიკური პასუხი აქვს. GPT-3, ანუ Open.AI-ის ენის მოდელი, რომელსაც ჟიპიტაური ეყრდნობა, იწვრთნება ინტერნეტში არსებული ინფორმაციით, რომელიც მცდარიც შეიძლება იყოს და სწორიც. მისი მხრიდან მცდარი პასუხის გაცემის შანსი იზრდება მაშინ, როცა ერთ კონკრეტულ საკითხზე ინტერნეტში ურთიერთგამომრიცხავი და სადავო ცნობებია გავრცელებული. თუმცა, როგორ მუშაობს ჟიპიტაური და კიდევ რა უნდა ვიცოდეთ, სანამ მასთან ინტერაქციას გადავწყვეტთ? ამ კითხვაზე Supernova-ს თანადამფუძნებელი, ზაალ გაჩეჩილაძე გვპასუხობს:

"მარტივი ანალოგით შეიძლება უფრო გასაგები გახდეს: ვთქვათ დავგუგლე 2 + 2; შეიძლება რომელიმე ვებგვერდზე ეწეროს, რომ 2 + 2 = 5; ეს არც იმას ნიშნავს რომ ეს ინფომრაცია სწორია და არც იმას ნიშნავს, რომ გუგლმა შეგვიყვანა მომხმარებელი შეცდომაში. იგივენაირად ხდება ჟიპიტაურის შემთხვევაშიც — ამ სისტემას წაკითხული აქვს ბევრი ტექსტი ბევრი ვებგვერდიდან. გუგლისგან განსხვავებით, ლინკებს კი არ გვთავაზობს, არამედ ამ ლინკებზე არსებულ ტექსტებს აწებებს ერთმანეთს"

ქართული AI კომპანიის გუნდმა გამოიყენა Open AI-ის ენის მოდელი GPT-3 და ავტომატიზებული თარგმნის API სერვისები. ამ ორი ტექნოლოგიური შესაძლებლობის ერთ ინტერფეისში გაერთიანებით Supernova-მ პირველი ნაბიჯი გადადგა იმისათვის, რომ ქართულენოვან აუდიტორიასაც ჰქონდეს დიდ ენობრივ მოდელებთან ქართულ ენაზე კომუნიკაციის შესაძლებლობა. გუნდის თქმით, გრძელვადიან პერსპექტივაში ეს პირველი ნაბიჯი უფრო დიდი ქართულენოვანი მოდელის შექმნამდე მიგვიყვანს. ჟიპიტაურთან თითოეული ინტერაქციით კი Supernova-ს გუნდს ამ მიზნის მიღწევაში ვეხმარებით.

თუმცა მანამ, სანამ მოდელი განვითარდება და უკუკავშირის გათვალისწინებით, დროთა განმავლობაში მასთან უფრო ნაყოფიერი დიალოგის გამართვას შევძლებთ, დიდი გზაა გასავლელი. აღსანიშნავია ისიც, რომ რამდენიმე პრობლემურ კითხვაზე (მათ შორის, აგვისტოს ომი) ChatGPT გადამოწმებულ ინფორმაციაზე დაყრდნობით გვპასუხობს, ხოლო ჟიპიტაური მცდარი ტექსტების გენერირებაში გუშინდელს მერე არაერთხელ ამხილეს. ჟიპიტაური გაცილებით ახალგაზრდა ჩატბოტია, ვიდრე ChatGPT, თან ქართულენოვან ინფორმაციასთან დაკავშირებულ სირთულეებს თუ გავითვალისწინებთ, თუმცა ეს ორი ჩატბოტი ინფორმაციულად ერთმანეთსაა აცდენილი, მიუხედავად იმისა, რომ ორივე მსგავს მოდელს იყენებს. ზაალ გაჩეჩილაძეს ისიც ვკითხეთ, თუ რა იწვევს მსგავს აცდენას?

"ChatGPT და GPT-3 სხვადასხვა მოდელებია. ChatGPT-ს დამატებით ნასწავლი აქვს ადამიანების მიერ მითითებული პასუხები. ყოფილა ახლანდელი ChatGPT-ს "იძულების" მაგალითები, როცა ცდილობდნენ, მას დაეწერა შეურაცხმყოფელი ტექსტები. არც ChatGPT არის ჯერჯერობით ამისგან დაზღვეული", — ამბობს ზაალ გაჩეჩილაძე.

როგორც უკვე აღვნიშნეთ, გუნდმა საიტზე განმარტებითი ტექსტი დაამატა, იმისათვის რომ მომხმარებლისთვის აეხსნათ, რომ ჟიპიტაურთან დიალოგისას მიღებული პასუხები შესაძლოა მცდარი იყოს. საინტერესოა, კიდევ რის გაკეთებას აპირებენ "სუპერნოვაში" საიმისოდ, რომ მოდელი უფრო სანდო გახდეს. მაგალითად, თუ განიხილება ფილტრების შემოღება ან თუ არის შესაძლებელი, კონკრეტულ სადავო ინფუთებს პასუხი გამაფრთხილებელი ტექსტის თანხლებით გაეცეს.

"ფილტრის შემოღება საკმაოდ რთული საკითხია. მიზანი, რისთვისაც გავუშვით ეს საიტი ასეთი ფორმით არის, რომ შევაგროვოთ შეფასებები მომხმარებლებისგან და ამ მოგროვილი მონაცემების გათვალისწინებით გავაუმჯობესოთ თარგმნის ხარისხი", — ამბობს ზაალ გაჩეჩილაძე.

ჟიპიტაური, ისევე, როგორც ChatGPT გვესაუბრება სხვადასხვა საკითხზე, პასუხს გვცემს კითხვებზე ისე, როგორც თანამოსაუბრე იზამდა ამას და ლინკების ნაცვლად გვთავაზობს სხვადასხვა ვებგვერდიდან ამოკრეფილ ტექსტს, კონტექსტის თანხლებით. თუმცა ის ასევე გვასწავლის, როგორი უნდა იყოს ჩვენი ქცევა სხვადასხვა ტიპის ტექნოლოგიურ პროდუქტთან ინტერაქციისას.

ჟიპიტაურთან "საუბარი" ამ ბმულზე გადასვლის შემდეგ შეგიძლიათ.

ენის მოდელები ჯერ კიდევ განვითარების ადრეულ საფეხურზეა, შესაბამისად ძალიან რთული და არაგონივრულია, ამა თუ იმ ინფორმაციის სანდოობის კუთხით ისინი საყრდენ რესურსებად მოვიაზროთ. მით უფრო ქართულენოვანი ჩატბოტის შემთხვევაში, რომელიც სულ რაღაც გუშინ ჩაეშვა და ელოდება, როდის შეიტანენ მომხმარებლები წვლილს მისი ავტომატიზებული პასუხების გაუმჯობესებაში.

მართალია, ჟიპიტაური ჯერ მხოლოდ ერთი დღისაა, თუმცა რაღაცები უკვე გვასწავლა. აქამდე Supernova-ს საქართველოში ასე ფართოდ ხელმისაწვდომი პროდუქტი არ შეუქმნია. ზაალ გაჩეჩილაძის თქმით, ჯერჯერობით ადრეა იმაზე საუბარი, თუ რა შეცვალა ან რას შეცვლის ჟიპიტაური ქართულ AI სფეროში. "თუმცა რისი შეცვლაც გვინდა ზუსტად ისაა, რომ არსებობდეს ქართულენოვანი დიდი ენობრივი მოდელი, რომელსაც ChatGPT-ს მსგავსი შესაძლებლობები ექნება", — ამბობს ზაალ გაჩეჩილაძე.