როგორ შეიცვლება ინტერნეტი მომავალ ათწლეულებში? ამის შესახებ მხატვრული ლიტერატურის ავტორებმა რამდენიმე შესაძლებლობა განიხილეს.

2019 წლის რომანში, სახელად Fall, ფანტასტმა მწერალმა, ნილ სტივენსონმა, წარმოიდგინა უახლოესი მომავალი, რომელშიც ინტერნეტი კვლავ არსებობს, თუმცა ის ისე არის დაბინძურებული მცდარი ინფორმაციით, დეზინფორმაციითა და რეკლამებით, რომ თითქმის გამოუსადეგარია.

ამ პრობლემასთან გასამკლავებლად, სტივენსონის რომანის პერსონაჟები იწერენ ე.წ. "გაფილტრულ საინფორმაციო არხებს" — ადამიანების მიერ შერჩეულ და გაფილტრულ ახალ ამბებსა და ინფორმაციებს, რომლებიც სანდოდ მიიჩნევა. თუმცა ამ სერვისის მთავარი ნაკლი ისაა, რომ ასეთ ექსკლუზიურ მომსახურებაზე ხელი მხოლოდ მდიდრებს მიუწვდებათ, კაცობრიობის დიდი ნაწილი კი იძულებულია, დაბალხარისხიან და გაუფილტრავ ინფორმაციას დასჯერდეს.

გარკვეულწილად, ეს რეალობაში უკვე მოხდა: ბევრმა მედიასაშუალებამ, როგორებიცაა The New York Times და The Wall Street Journal, გადარჩეულ მასალებზე წვდომა ფასიანი გახადა. ამავდროულად, სოციალურ პლატფორმებზე, მაგალითად X და TikTok, მცდარი ინფორმაცია უკონტროლოდ ვრცელდება.

სტივენსონის წინასწარმეტყველების უნარი ნამდვილად შთამბეჭდავია —1992 წლის რომანში Snow Crash მწერალმა მეტავერსის არსებობა იწინასწარმეტყველა. ასევე, სტივენსონის 1995 წლის რომანის, სახელად Diamond Age, სიუჟეტის საკვანძო ელემენტი მოწყობილობაა, რომელიც თითქმის ჩატბოტივით ფუნქციონირებს.

ერთი შეხედვით, დღევანდელი ჩატბოტები მცდარი ინფორმაციის მიერ გამოწვეული ეპიდემიის წინააღმდეგ გამოსავალს გვთავაზობენ. ფაქტებზე დაფუძნებული ინფორმაციის მიწოდებით, ჩატბოტებს შეუძლიათ მაღალხარისხიანი ინფორმაციის ალტერნატიული წყაროები შექმნან, რომლებზე წვდომაც ფასიანი არ იქნება. თუმცა, ირონიულია, რომ სწორედ ასეთი ჩატბოტების მიერ გენერირებული მასალა ინტერნეტის მომავლისთვის ყველაზე დიდ საფრთხეს შეიძლება წარმოადგენდეს. ამ საფრთხეზე ათწლეულების წინ არგენტინელმა მწერალმა, ხორხე ლუის ბორხესმა, მიგვანიშნა.

ჩატბოტების აღზევება

დღესდღეობით, ინტერნეტის საკმაოდ დიდი ნაწილი კვლავ მოიცავს ფაქტებზე დაფუძნებულ და თითქოსდა სარწმუნო ინფორმაციას, როგორებიცაა სტატიები და წიგნები. მათი დიდი ნაწილი რეცენზირებულია, ფაქტობრივი მონაცემები გადამოწმებულია ან მათი სანდოობა რაიმე სხვა გზით არის დადასტურებული.

დიდი ენობრივი მოდელების, ანუ LLM-ების — იმ ძრავების, რომლებიც ChatGPT-ის, Copilot-ისა და Gemini-ს მსგავს ბოტებს ამუშავებს — დეველოპერები ამ რესურსით სარგებლობენ. თუმცა, თავიანთი "მაგიის" ჩასატარებლად, ამ მოდელებმა წვრთნის პროცესში მაღალხარისხიანი ტექსტების უზარმაზარი რაოდენობა უნდა გადაამუშაონ. ინტერნეტწყაროებიდან უკვე შეგროვდა უამრავი ტექსტი, რომლებიც განვითარების პროცესში მყოფ LLM-ებს მიეწოდათ. პრობლემა ისაა, რომ ინტერნეტი მაინც ამოწურვადი რესურსია. ჩატბოტების გამოჩენიდან მალევე OpenAI-მ და მსგავსმა კომპანიებმა გამომცემლობებთან გარიგებების დადება დაიწყეს, რათა თავიანთი "გაუმაძღარი" ბოტებისთვის დასამუშავებელი მასალა მიეღოთ. თუმცა, ერთ-ერთი პროგნოზის თანახმად, მაღალხარისხიანი ინფორმაციის ნაკლებობა შეიძლება 2026 წელს ისევ ვიხილოთ.

ვინაიდან ჩატბოტების მიერ გენერირებული ტექსტები საბოლოოდ ისევ ინტერნეტში ხვდება, ეს მეორე თაობის მასალა კიდევ უფრო აბინძურებს ონლაინსივრცეს. ეს ტექსტები სავსეა გამოგონილი ფაქტებით, რასაც "ჰალუცინაციებს" უწოდებენ და ისეთი აბსურდული შეცდომებიც კი გვხვდება, როგორიცაა პიცაზე წებოს დასხმის რეკომენდაცია. ასევე, რაც უფრო მეტ დროს გაატარებს ჩატბოტი გარკვეული ტიპის საზოგადოებასთან, მით მეტი შანსია მათი შემაშფოთებელი შეხედულებებიც გადაიღოს. ეს კი Microsoft-მა საკუთარ თავზე ცუდად გამოცადა: 2016 წელს კომპანიას მოუწია ბოტის, სახელად Tay-ს გათიშვა, რადგან მან რასისტული და სექსისტური ფრაზების გამეორება დაიწყო.

დროთა განმავლობაში, ამ პრობლემებმა ინტერნეტში არსებული მასალა შესაძლოა იმაზე უსარგებლო და არასანდო გახადოს, ვიდრე დღესაა. დამატებით, თუ დიდი ენობრივი მოდელები განაგრძობენ უშინაარსო ინფორმაციების დამუშავებას, შესაძლოა კიდევ უფრო პრობლემური ტექსტები დააგენერირონ, რომლებიც საბოლოოდ ისევ ინტერნეტში აღმოჩნდება.

უსასრულო და უსარგებლო ბიბლიოთეკა

რთული წარმოსადგენი არ არის უკუკავშირის ისეთი ჯაჭვი, რომელიც დეგრადაციის უწყვეტ პროცესს იწვევს, რადგან ბოტები საკუთარივე არასრულყოფილი ტექსტებით იკვებებიან. 2024 წლის ივლისში ჟურნალ Nature-ში გამოქვეყნებულმა ნაშრომმა შეისწავლა, თუ რა შედეგები მოჰყვება ხელოვნური ინტელექტის მოდელების რეკურსიულად გენერირებულ მონაცემებზე წვრთნას. კვლევამ აჩვენა, რომ ამგვარად გაწვრთნილ სისტემებში "შეუქცევადმა დეფექტებმა" შეიძლება "მოდელის კოლაფსამდე" მიგვიყვანოს — ზუსტად ისე როგორც სურათის ასლი, შემდეგ ამ ასლის ასლი და საბოლოოდ ამ ასლის ასლი თანდათან კარგავს ორიგინალთან სიზუსტეს.

რამდენად შეიძლება გაუარესდეს მდგომარეობა?

ეს კარგადაა ნაჩვენები ბორხესის 1941 წლის მოკლე მოთხრობაში, სახელად The Library of Babel. ვიდრე ტიმ ბერნერს-ლი ინტერნეტის არქიტექტურას შექმნიდა, 50 წლით ადრე ბორხესმა უკვე წარმოიდგინა მისი ანალოგიური ვერსია. 3000-სიტყვიან მოთხრობაში მწერალი წარმოიდგენს სამყაროს, რომელიც ექვსკუთხა ოთახების უზარმაზარი და უსასრულო რაოდენობისგან შედგება. თითოეულ ოთახში თაროებზე ერთნაირი ტომებია ჩამწკრივებული და როგორც ამ სამყაროს ბინადარნი ინტუიციურად ხვდებიან, წიგნები მათი ანბანის ასოების ყველა შესაძლო კომბინაციას უნდა შეიცავდეს.

თავდაპირველად ამის გააზრება სიხარულის მომგვრელია: აუცილებლად უნდა არსებობდეს წიგნები, რომლებიც დეტალურად აღწერს კაცობრიობის მომავალს და ცხოვრების მნიშვნელობაზეც დეტალურად მოგვითხრობს. სამყაროს ბინადარნი ასეთი წიგნების ძებნას დაიწყებენ, თუმცა მალევე აღმოაჩენენ, რომ წიგნების უმეტესობა ასოების უაზრო კომბინაციებისგან შედგება. ჭეშმარიტება სადღაც იქ არის — თუმცა, იქვეა ყველა შესაძლო სიცრუეც და ეს ყველაფერი უზარმაზარი მოცულობის უშინაარსო ტექსტშია ჩაფლული. საუკუნოვანი ძიების შემდეგ, ისინი მხოლოდ რამდენიმე აზრიან ფრაგმენტს პოულობენ. და მაინც, არ არსებობს იმის დადგენის გზა ეს მკაფიო ტექსტები სიმართლეს ამბობს თუ სიცრუეს. იმედი კი ნელ-ნელა სასოწარკვეთად იქცევა.

გახდება ოდესმე ინტერნეტი ისეთი დაბინძურებული, რომ მხოლოდ მდიდარი ადამიანები შეძლებენ ზუსტი და სანდო ინფორმაციის მოპოვებას? ასევე, ჩატბოტების უსასრულო რაოდენობა იმდენად დამახინჯებულ ინფორმაციას ხომ არ წარმოქმნის, რომ ინტერნეტში ზუსტი ფაქტების მოძიება თივის ზვინში ნემსის ძებნას დაემსგავსოს? ინტერნეტს ხშირად კაცობრიობის ერთ-ერთ უდიდეს მიღწევად მიიჩნევენ. თუმცა, სხვა რესურსების მსგავსად, მისი შენარჩუნება და მართვაც დიდ ძალისხმევას მოითხოვს, რათა ბორხესის მიერ წარმოდგენილ დისტოპიურ ხედვასთან შეჯახება არ მოგვიწიოს.