ალბათ, ხშირად გაგკვირვებიათ, როგორ გთავაზობთ ფეისბუქის სიახლეების ზოლი ზუსტად იმ ტიპის პროდუქტებს, რომელიც ონლაინ მაღაზიაში რამდენიმე წუთის წინ ნახეთ. რა იცის ფეისბუქმა, რომ ახალი ყურსასმენის ყიდვა გინდათ? იმ ალგორითმების უკან, რომლებმაც "თქვენი სურვილების შესახებ იციან" და მსგავს, თქვენზე მორგებულ სიახლეების ზოლს (News Feed) გთავაზობენ, მონაცემთა მეცნიერები დგანან. ჩვენ კი მათთვის გამოსადეგ ინფორმაციას, მოწონების ღილაკზე ერთხელ დაჭერით ან სქროლვისას კონკრეტული ტიპის პოსტთან რამდენიმეწამიანი დაყოვნების გზითაც კი, სულ უფრო სწრაფად და სულ უფრო დიდი მოცულობით ვქმნით.

მხოლოდ 2020 წლის მანძილზე მონაცემები 20 ზეტაბაიტით გაიზარდა, რაც იმაზე მეტია, ვიდრე კაცობრიობას, 2016 წლამდე, ისტორიის მანძილზე შეუქმნია. მეორე მხრივ კი, ამ პროცესს თან სდევს მონაცემთა სანდოობის გამოწვევაც. IBM-ის შეფასებით, მონაცემების უხარისხობა ამერიკის ეკონომიკას წლიურად 3.1 ტრილიონი დოლარი უჯდება. ამის შესახებ საქართველოს ბანკის მონაცემთა მეცნიერი — ირაკლი გოგატიშვილი გვიყვება.

მომავლის ბიზნესი და მონაცემები

"მომავალი ადამიანზე ორიენტირებული და ხელოვნურ ინტელექტზე დაფუძნებული კოგნიტიური ბიზნესისაა, სადაც კომპანიები ქმნიან გამჭრიახ სამუშაო პროცესს, რათა ინოვაციური გამოცდილება შეუქმნან მომხმარებლებს, თანამშრომლებსა და პარტნიორებს ეკოსისტემაში. ამის წინაპირობებს ქმნის ციფრული და გამოთვლითი ტექნოლოგიების განვითარება, რამაც ჩამოაყალიბა სენსორული ხელსაწყოებით და პროგრამებით გაჯერებული საგანთა ინტერნეტი (Internet of Things). ამ ქსელში მზარდი ტემპით იქმნება და მიმოიქცევა დიდი მოცულობის მრავალმხრივი მონაცემები ტექსტური, ხმოვანი, ფოტო თუ ვიდეო ფორმატით", — ამბობს ირაკლი გოგატიშვილი.

აღსანიშნავია, რომ ქართულ სინამდვილეშიც სულ უფრო იკვეთება აღნიშნული შესაძლებლობის გონივრულად გამოყენების ტენდენცია. ეს უფრო საბანკო, ტელკო და საცალო მიწოდების ბიზნესებს შეეხება, რომლებიც სულ უფრო მეტ რესურსს უთმობენ მონაცემთა მეცნიერების მიმართულების განვითარებას. ამას ხელს უწყობს მონაცემთა და სტარტაპ თემთა აქტიურობის ზრდაც, როგორც ინოვაციური პროდუქტების შექმნის, ასევე საგანმანათლებლო კუთხით.

მონაცემთა მეცნიერება საქართველოში

მიუხედავად უამრავი ბარიერისა, რომელიც ანალიტიკის მიმართულებით განათლების ნაკლებობას, ტექნიკურ თუ ეთიკურ დეტალებს ეხება, მონაცემთა მეცნიერება საქართველოში მაინც აქტუალური მიმართულება ხდება. როგორც ირაკლი ამბობს, ის ჯერ კიდევ ჩანასახოვან ეტაპზეა და მნიშვნელოვანია ვიცოდეთ, არასაკმარისი კომპეტენტურობის შემთხვევაში, რამდენად სახიფათო შეიძლება იყოს ამ სფეროში მოღვაწეობა.

"მონაცემთა მეცნიერება ოთხი აუცილებელი, მაგრამ არასაკმარისი პირობის თანაკვეთას გულისხმობს. ესენია: მონაცემების დამუშავება და კოდირება, მათემატიკურ-სტატისტიკური უნარები, დარგობრივი ექსპერტიზა და მონაცემთა ეთიკა. ნებისმიერი ნაკლული თანაკვეთა სახიფათო ზონაა, რაც ვარგისი გადაწყვეტის მოჩვენებას ქმნის და რესურსების ფლანგვას იწვევს".

საქართველოს ბაზარი საკმაოდ პატარაა, თუმცა, ამის მიუხედავად კომპანიები სულ უფრო ინტერესდებიან მონაცემთა მეცნიერებით. როგორც ირაკლი ამბობს, მიუხედავად მწირი ფინანსური რესურსებისა, ჩვენსავით პატარა ქვეყანასაც კი შეუძლია კონკურენცია გაუწიოს ტექნოლოგიური გიგანტების მიერ შექმნილ პროდუქტებს. მაგალითად ირაკლის Fast.Ai-ის შემთხვევა მოჰყავს. კომპანიის ხელოვნური ინტელექტის ალგორითმმა 40%-ით აჯობა Google-ის მკვლევართა გუნდის მიერ შექმნილ ალგორითმს. აღსანიშნავია, რომ ეს 2018 წელს მოხდა, სამი სტუდენტისგან შემდგარი გუნდი ადვილად ხელმისაწვდომ გამოთვლით რესურსებს იყენებდა, ხოლო Google ექსკლუზიურ, თავისივე მძლავრ გამოთვლით რესურსს.

ნიშნანდობლივია სხვა დაბრკოლებები, რომელსაც ბაზრის სიმცირესთან ერთად საქართველო აწყდება ამ სფეროში. მათგან ერთ-ერთი მნიშვნელოვანია ის, რომ გლობალურ ტექნოლოგიურ პროდუქტებს ქართული ენა არ ესმით. ვგულისხმობთ ხმოვან ასისტენტებს, როგორიცაა Siri, Alexa, Google Assistant. რა თქმა უნდა, მათი შემქმნელი კომპანიებისთვის ქართული ბაზარი ზედმეტად პატარაა საიმისოდ, რომ მას მოერგონ. ირაკლი გოგოტიშვილისთვის კი ეს ერთ-ერთი მნიშვნელოვანი მიმართულებაა, რომელზეც ამჟამად, საქართველოს ბანკის გუნდთან ერთად მუშაობს. სწორედ ამას შეეხება მისი გამოსვლა მონაცემების ფესტივალზე DataFest Tbilisi:

"გამოსვლა ეძღვნება ქართულ გამგებს (Georgian NLU – Natural Language Understander), ენის მანქანურ მოდელს, რომლის მიზანიც არის თავისუფალი ქართული ტექსტიდან აზრის გამოტანა. ვეცდები, გავაზიარო მიდგომა, რამაც შეგვაძლებინა მოკლე დროში მნიშვნელოვანი პროგრესის მიღწევა და ვაჩვენო მომავალი ხედვა, თუ როგორ წარმოგვიდგენია შემდგომი განვითარება, რა შეიძლება მოიმოქმედოს საზოგადოებამ, რომლის ენაც ტექნოლოგიური გიგანტების ყურადღების მიღმა რჩება", — ამბობს ირაკლი გოგატიშვილი

მონაცემებიდან ხელოვნურ ინტელექტამდე

მონაცემები ხელვნური ინტელექტის საშენი მასალაა. მოდელი კი, რომელის მონაცემებს ხელოვნური ინტელექტის ალგორითმში იყენებს, შესაძლოა მოიხმარდეს დასწავლის მრავლობით მექანიზმს. ზოგი სრულიად ნედლს მონაცემებს მოიხმარს, ზოგი კი გარდაქმნილს. "ტრანსფორმაციის ბუნებაც განსხვავებული შეიძლება იყოს. სადაც მინიშნებითი სწავლება (supervised learning) გამოიყენება, მონაცემების დაჭდევება აუცილებელია, ხოლო მიუნიშნებელი წვრთნის (unsupervised learning) შემთხვევაში —ზედმეტია. მნიშვნელოვანია, ასევე, ნედლი მონაცემებიდან ამხსნელი ცვლადების აწყობაც (feature engineering) დარგობრივი ცოდნის გამოყენებით. წახალისებით დასწავლის (reinforcement learning) პირობებში კი, სრულიად ნედლი მონაცემებიც შეიძლება გამოდგეს", — ამბობს ირაკლი გოგატიშვილი.

ეს მიმართულება საქართველოში სულ უფრო იზრდება, მას კი ცალკე, მასშტაბური ფესტივალი ეძღვნება, რომელიც ზემოთაც ვახსენეთ — DataFest Tbilisi. როგორც უკვე აღვნიშნეთ, ამ მიმართულების განვითარებას კერძო სექტორშიც აქტიურად ცდილობენ:

"ამჟამად, საქართველოს ბანკი აძლიერებს მონაცემთა ანალიტიკის მიმართულებას, მოიზიდავს მონაცემთა მეცნიერებისა და ინჟინერთა კადრებს, ავითარებს შესაბამის უნარებს და ნერგავს მოწინავე ტექნოლოგიებს. სწრაფად მზარდი მონაცემთა ტომი ქმნის თვითსწავლად სარეკომენდაციო სისტემებს, ენისა და მეტყველების ტექნოლოგიებს, გადაწყვეტილების ძრავებს, სიყალბის გამოსავლენ სისტემებს და ა.შ. მონაცემთა ანალიტიკის გასერვისება მოიაზრება, როგორც კომპანიის ერთ-ერთი მთავარი კომპეტენცია, რომლის მასშტაბიც უახლოეს ხანებში მნიშვნელოვნად გაიზრდება", — გვიყვება ირაკლი გოგატიშვილი.

ჩვენ კი, ისღა დაგვრჩენია, თვალი მივადევნოთ მონაცემთა მეცნიერების განვითარებას საქართველოში. თუმცა, მხოლოდ მაყურებლად ყოფნა არც ერთ შემთხვევაში მოგვიწევს. ამ პროცესის მონაწილეები ნელ-ნელა, ყველა გავხდებით და ამისთვის არ არის აუცილებელი მონაცემთა ანალიზის პროცესში ვიყოთ ჩართული, ან მონაცემთა მეცნიერი გავხდეთ. ამაში მონაწილეობა ჩვენი ნებისმიერი სახის ციფრული აქტივობით შეგვიძლია. მათ შორის, ამ სტატიის წაკითხვითაც...