ქართველი სპეციალისტი, რომელიც Microsoft-ში ადამიანის ავატარებს ქმნის

კომპანია Microsoft მსოფლიო ტექნოლოგიური გიგანტია, რომელიც არაერთ საინტერესო პროდუქტს გვთავაზობს. მათ შორისაა Microsoft Teams, რომლითაც უამრავი ადამიანი სარგებლობს, მათ შორის საქართველოშიც. ეს აპლიკაცია შესაძლებლობას იძლევა, რომ ვიდეოზარებში ციფრული ავატარის სახით ჩაერთოთ, მაგრამ იცოდით, რომ მათ შექმნაში ქართველი ახალგაზრდაც მონაწილეობს?

ეს გივი მეიშვილია, კომპიუტერული მეცნიერებების სპეციალისტი, რომელიც Microsoft-ში ადამიანის სახის სამგანზომილებიან რეკონსტრუქციასა და ავატარებზე მუშაობს. საკუთარი გამოცდილების შესახებ ის DataFest Tbilisi-ს ღონისძიებაზეც ისაუბრებს, რომელიც 19-21 სექტემბერს ჩატარდება. მანამდე კი მასთან ინტერვიუს გთავაზობთ, რომელშიც რესპონდენტი გვიყვება, როგორია მისი საქმიანობის სპეციფიკა და რა გზა განვლო, სანამ Microsoft-ში მოხვდებოდა.

მოგვიყევით საქართველოსა და მის საზღვრებს გარეთ მიღებული განათლებისა და გამოცდილების შესახებ. რა უძღოდა წინ Microsoft-ში მოხვედრას?

კომპიუტერულ მეცნიერებასთან პირველად შეხება 2008 წელს მქონდა, როდესაც თბილისის სახელმწიფო უნივერსიტეტში ზუსტ და საბუნებისმეტყველო მეცნიერებათა ფაკულტეტზე ჩავირიცხე. 2012 წელს თსუ-სა და საფრანგეთში არსებული სასწავლო დაწესებულება Universite Paris 8-ისგან კომპიუტერული მეცნიერებების განხრით ორმაგი ბაკალავრის ხარისხი მივიღე.

ამის შემდეგ გადავწყვიტე, სწავლა შვეიცარიაში მდებარე ჟენევის უნივერსიტეტის მაგისტრატურის საფეხურზე იმავე მიმართულებით გამეგრძელებინა, პარალელურად კი ჟენევაში, გაერთიანებული ერების ორგანიზაციაში, Java Software დეველოპერის პოზიციაზე ვმუშაობდი. მაგისტრის ხარისხი 2017 წელს დავიცავი და უკვე დოქტორანტურის საფეხურზე გადავინაცვლე, ამჯერად შვეიცარიაში არსებულ ბერნის უნივერსიტეტში, ხელოვნური ინტელექტისა და ნეირონული ქსელების განხრით.

დოქტორანტურაზე სწავლისას სხვადასხვა პრესტიჟულ საერთაშორისო კონფერენციაში ვიღებდი მონაწილეობას, რომელთა ფარგლებშიც რამდენიმე სამეცნიერო ნაშრომი გამოვაქვეყნე (იხილეთ ბმული). 2020 წელს სადოქტორო დისერტაცია დავიცავი, სახელწოდებით "Learning Representations for Controllable Image Restoration" (იხილეთ ბმული). იმავე პერიოდში ვმუშაობდი ადამიანის სახის 2D და 3D მოდელირებაზე. ასევე, მეთოდებზე, რომელთა ძირითადი მიზანიც აუდიო/ვიდეო სიგნალებზე დაყრდნობით ადამიანის სახის რეკონსტრუქცია/აღდგენაა. სადოქტორო სწავლებისას შესაძლებლობა მომეცა, სტაჟირება გამევლო Disney Research-სა და Microsoft Research-ში, საბოლოოდ კი, სადოქტოროს დაცვის შემდეგ, 2 წლის წინ, Microsoft-ში კვლევითი მეცნიერის პოზიციაზე ამიყვანეს.

რას საქმიანობთ Microsoft-ში და რატომაა საინტერესო თქვენთვის ეს სფერო?

ამჟამად Microsoft-ში ადამიანების სამგანზომილებიან ავატარებზე ვმუშაობ, რაც სახის 3D მოდელის, წარბების, თმის ვარცხნილობისა და აქსესუარების ციფრულ რეკონსტრუქციას გულისხმობს. ამ სფეროსადმი ინტერესი ჯერ კიდევ მაგისტრატურაზე სწავლის პერიოდში გამიჩნდა, მაგრამ სადოქტორო ნაშრომზე მუშაობისას განსაკუთრებულად გამიმძაფრდა.

სწორედ ამ დროს დავინტერესდი იმით, თუ როგორ იძენს და იღრმავებს ადამიანი ცოდნას ნეირონულ დონეზე — ესაა კითხვა, რომელზეც ცალსახა პასუხი ჯერ არ გვაქვს და ამას მეცნიერები დღემდე აქტიურად იკვლევენ. მინდოდა გამეგო, როგორ მიიღწევა მანქანური დასწავლის სფეროში ნეირონული ქსელების გაწვრთნა სხვადასხვა სპეციფიკური პრობლემების გადასაჭრელად, იქნება ეს სურათებში ობიექტების კლასიფიკაცია და სეგმენტაცია თუ სხვა. მაინტერესებს ისიც, თუ როგორ შეგვიძლია ვასწავლოთ მანქანებს აზროვნება, ინფორმაციის ათვისება, დამუშავება და გადაწყვეტილებების მიღება ისე, რომ ამ პროცესში ადამიანი ან ჩაერიოს და ყველაფერი ავტომატურად წარიმართოს.

რატომაა მნიშვნელოვანი Microsoft-ისთვის ავატარები და მის რომელ პროდუქტებში გვხვდება?

Microsoft-ში ჩვენი სლოგანია "To empower every individual and every organization on the earth to accomplish more", ანუ — "დედამიწაზე ყველა ინდივიდსა და ორგანიზაციას მივცეთ შესაძლებლობა, მიაღწიოს მეტს". ზუსტად ესაა ის ძირითადი მოტივატორი, რომელიც სხვადასხვა პროდუქტის განვითარებასა და დახვეწაში გვეხმარება.

Microsoft-ის ერთ-ერთი ყველაზე ცნობილი პროდუქტი, რომელშიც ავატარები გვხვდება, Microsoft Teams-ია. მე მჯერა, რომ ციფრული ავატარები არის საშუალება, რომელიც დისტანციური მუშაობის პირობებში ჩვენი შრომის ნაყოფიერებას გაზრდის.

ციფრული ავატარების შექმნის პროცესში მნიშვნელოვანია, რომ ისინი ავთენტური იყოს და ადამიანის სხვადასხვა ინდივიდუალურ მახასიათებელს მაქსიმალურად იმეორებდეს. ასეთია, მაგალითად, ვარცხნილობის სტილი და სახის ნაკვთები. ასევე, ავატარი შეძლებისდაგვარად რეალისტური უნდა იყოს. მნიშვნელოვანი ასპექტია მსგავსი მოდელის ინკლუზიურობაც, ანუ რამდენად კარგად შეგვიძლია ავატარების გენერირება სხვადასხვა ეთნიკური ჯგუფისთვის.

ფოტო: Microsoft

რამდენად ამარტივებს ავატარების შექმნას ხელოვნური ინტელექტი და რატომ?

ხელოვნური ინტელექტის ამა თუ იმ მიმართულებაში ბოლოდროინდელი წარმატებები ავატარების ავტომატური გენერაციისთვის ერთ-ერთი ყველაზე მნიშვნელოვანი წინაპირობაა. ავატარის სხვადასხვა კომპონენტის შექმნას წინ რამდენიმე ნეირონული ქსელის გაწვრთნის პროცესი უძღვის, რაც, თავის მხრივ, ბევრ ტექნიკურ ნიუანსს მოიცავს.

ხელოვნური ნეირონული ქსელების მიერ დიდი რაოდენობის ციფრული მონაცემების დამუშავება საშუალებას გვაძლევს, შევქმნათ ადამიანის სახის ციფრული მოდელები, რომლებიც სხვადასხვა და, ასევე, კონკრეტული ადამიანის ინდივიდუალურ ვიზუალს თითქმის ზედმიწევნით წარმოაჩენს.

რა ტექნოლოგიურ სირთულეებს აწყდებით თქვენს საქმიანობაში ყველაზე ხშირად? რა გამოწვევებს უკავშირდება ადამიანის სახის ციფრული მოდელის შექმნა?

ჩვენს საქმიანობაში ტექნიკური სირთულეები უხვადაა. მაგალითად, ნეირონული ქსელების გასაწვრთნელად დიდძალი ციფრული მონაცემია საჭირო. აქ იგულისხმება ადამიანის სახის ესა თუ ის მახასიათებელი, რომელთა ერთობლიობაც ჩვენს ფიზიკურ იდენტობას მეტწილად განსაზღვრავს. ეს კი ინფორმაციის განსაკუთრებით სენსიტიურ ტიპს განეკუთვნება, რის გამოც მსგავს ბაზაზე მუშაობისას სერიოზული სიფრთხილე გვმართებს. აქედან გამომდინარე, ნეირონული ქსელების სწავლებისთვის საკმარისი მონაცემების შეგროვება საკმაოდ ძნელია.

მნიშვნელოვანია ისიც, რომ ავატარის მოდელი კონკრეტული ინდივიდის გარეგნობის მაქსიმალურ რეპრეზენტაციას უნდა გვთავაზობდეს. მაგალითად, შესაძლებელია, ადამიანს ძალიან იშვიათი ვარცხნილობა გამოარჩევდეს. მისი რეკონსტრუქციისთვის აუცილებელია, რომ ნეირონულ ქსელს ასეთი ვარცხნილობის ტიპი სწავლების პროცესში უკვე ნანახი ჰქონდეს. შესაბამისად, მსგავს სისტემებთან მუშაობის დროს გასათვალისწინებელი და სასურველია, რომ გასაწვრთნელად გამოყენებული მონაცემთა ბაზა შეძლებისდაგვარად მდიდარი და მრავალფეროვანი იყოს.

კიდევ ერთი გამოწვევა დროს უკავშირდება. იმ შემთხვევაშიც კი, თუ გვაქვს მოდელი, რომელიც მაღალი ხარისხის ავატარის რეკონსტრუქციას გვთავაზობს, მას სწრაფი გენერაციის უნარიც უნდა ჰქონდეს. ეს იმისთვის, რათა მომხმარებლისთვის ლოდინის პერიოდი შემცირდეს.

რას ფიქრობთ მეტავერსზე? თქვენი აზრით, არის თუ არა ეს ავატარების ტექნოლოგიის პოტენციური მწვერვალი და რას უნდა ველოდოთ მომავალში?

ჯერ კიდევ 10 წლის წინ ჩვენ მეტავერსზე არც კი ვსაუბრობდით. ამ პერიოდში მუშაობის პროცესში პრობლემები, ძირითადად, ობიექტების კლასიფიკაციით შემოიფარგლებოდა.

ამის მიუხედავად, ბოლო წლების განმავლობაში ხელოვნური ინტელექტის სხვადასხვა ტიპი საგრძნობლად დაიხვეწა. აღნიშნულ დარგში მიღწეულმა არაერთმა წარმატებამ და წინსვლამ ის ტექნოლოგიური აპარატი მოგვცა, რომლის მეშვეობითაც სწორედ მეტავერსის მსგავსი პროდუქტების განვითარებაზე ვმუშაობთ, რაც სულ რაღაც 1 დეკადის წინ თითქმის წარმოუდგენელი იყო. დღესდღეობით ჩვენ უკვე მეტავერსზე ვართ ფოკუსირებული, თუმცა მე მიმაჩნია, რომ ტექნოლოგიური პროგრესის პირობებში ახლო მომავალში კიდევ ბევრ სხვა საინტერესო პროდუქტს ვიხილავთ.

რაც შეეხება Microsoft-ს, თავს ბედნიერ ადამიანად მივიჩნევ, რადგან შესაძლებლობა მომეცა, მემუშავა იმ სფეროში, რომელსაც ჩემი სადოქტორო დისერტაცია ეხებოდა. Microsoft, როგორც კომპანია, ხელოვნური ინტელექტის განვითარებაში საკმაოდ დიდ ინვესტიციებს დებს. ის საკუთარ პროდუქტებში სხვადასხვა AI სისტემას აქტიურად ნერგავს, ამიტომ მომავლის ტექნოლოგიებში საკუთარ წვლილს ისიც აუცილებლად შეიტანს.

როგორც ვიცით, DataFest Tbilisi 2024-ის ერთ-ერთი სპიკერი იქნებით. რომელ საკითხებზე ისაუბრებთ და რა ინფორმაციის მიღებას შეძლებს დამსწრე საზოგადოება?

წლევანდელი ღონისძიების ფარგლებში ვისაუბრებ სხვადასხვა ციფრულ ტექნოლოგიაზე, რომლებიც ადამიანის სახის მოდელირებაში, აღდგენასა და დამუშავებაში გამოიყენება. უფრო კონკრეტულად, მიმოვიხილავ იმ პროგრესს, რომელიც ამ სფეროში ბოლო 10-25 წლის განმავლობაში გვაქვს. ამასთან ერთად, ყურადღებას გავამახვილებ იმაზეც, თუ ტექნოლოგიური განვითარების რა ეტაპზე ვართ დღეს.

გვითხარით, რამდენად მნიშვნელოვანია DataFest-ის მსგავსი ღონისძიების ჩატარება საქართველოში და რატომ?

ბოლო 10 წლის განმავლობაში ხელოვნური ინტელექტის, როგორც დარგისა და მიმართულების, რენესანსის ერთ-ერთი მთავარი წინაპირობა უამრავი საერთაშორისო კონფერენციაა. ასევე, ამ თემის ირგვლივ გამოქვეყნებული სამეცნიერო ნაშრომები, რომლებიც ნებისმიერი დაინტერესებული პირისთვისაა ხელმისაწვდომი. ეს საშუალებას გვაძლევს, სფეროში არსებულ ტენდენციებს გავეცნოთ და მის განვითარებაში ჩვენი ინდივიდუალური წვლილიც შევიტანოთ.

DataFest Tbilisi-ს ტიპის ღონისძიებების ორგანიზება ძალიან მნიშვნელოვანია, რადგან ეს ერთმანეთისთვის ხელოვნური ინტელექტის გამოყენება/განვითარების შესახებ ცოდნისა და დაგროვებული გამოცდილების გაზიარების უნიკალური შესაძლებლობაა. ვფიქრობ, DataFest Tbilisi ხელს უწყობს იმას, რომ აღნიშნულ დარგში საყურადღებო მიღწევებს რაც შეიძლება მეტი პროფესიონალი და სტუდენტი გაეცნოს, დაინტერესდეს და საქართველოში ამ მიმართულების წინსვლისთვის საჭირო ნაბიჯები გადადგას. ასევე, მიმაჩნია, რომ მსგავსი ფესტივალები პროფესიული კონტაქტების გაცვლისა და კომპანიებს შორის სხვადასხვა საინტერესო თანამშრომლობის დასამყარებლადაც უმნიშვნელოვანესია. აქედან გამომდინარე, დიდ მადლობას ვუხდი ამ ღონისძიების ორგანიზატორებს.

DataFest Tbilisi აღმოსავლეთ ევროპისა და ცენტრალური აზიის მასშტაბით მონაცემთა ყველაზე დიდი ფესტივალია. 19-21 სექტემბერს მის ფარგლებში თავს მოიყრიან დიზაინერები, დეველოპერები, მარკეტერები, მონაცემთა ანალიტიკოსები, ხელოვნური ინტელექტის ინჟინრები, სტარტაპერები, ჟურნალისტები და ტექნოლოგიური სფეროთი დაინტერესებული სხვა ადამიანები.

ღონისძიების განმავლობაში დამსწრე საზოგადოებას საშუალება ექნება, სხვადასხვა ქვეყნიდან სპეციალურად DataFest-ისთვის ჩამოსულ სპიკერებს მოუსმინოს. მათ შორის იქნებიან წარმატებული ქართველებიც, რომლებიც წამყვან ტექნოლოგიურ კომპანიებში არიან დასაქმებულნი.

თუ სტატიაში განხილული თემა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ტექნოლოგიებზე.