საქართველოში პირველად, საქართველოს ბანკმა მონაცემთა მიმართულებით ყველაზე მასშტაბური პროექტი — Data Challenge-ების სერია დაიწყო. პროექტის ფარგლებში პირველი სერიის 3 გამარჯვებული გამოვლინდა, ესენია: Pier Piper, Synapse და Brainblinker.

როგორც საქართველოს ბანკის მონაცემთა მეცნიერი, მარიამ არუსტაშვილი გვიყვება, Data Challenge-ების გრძელვადიანი მიზანია, საქართველოში მონაცემთა მეცნიერებისა და ინჟინერიის პოპულარიზაცია, საინტერესო ადამიანების აღმოჩენა და ბანკში არსებული ამოცანების ახალი გადაწყვეტის მიგნება.

Data Challenge-ის პირველი ამოცანა სარეკომენდაციო სისტემის ალგორითმულ გადაწყვეტას ეხებოდა. გამოწვევაში როგორც ინდივიდუალური, ასევე რამდენიმე ადამიანისგან დაკომპლექტებული 125 გუნდი იღებდა მონაწილეობას. აღსანიშნავია, რომ 12-მა გუნდმა საქართველოს ბანკის მიერ დადგენილ მინიმალურ ზღვარს გადააჭარბა. მათ შორის პირველი 3 კი 30 000, 15 000 და 5 000 ლარით დასაჩუქრდა.

ერთ-ერთი გამარჯვებული გუნდის Pier Piper-ის წევრი, ნიკა მაჭარაძე მსგავსი გამოწვევებით განპირობებულ მოტივაციაზე გვესაუბრა და ის სამ ნაწილად დაყო:

  1. კონტრიბუციის მოტივაცია — შენი გაწეული სამუშაო შეიძლება ყოველდღიურად ათიათასობით მომხმარებელზე აისახოს;
  2. შეჯიბრის ფორმატი, როცა სხვა მონაწილეებს ეჯიბრები და გინდა გაიმარჯვო, იყო საუკეთესო;
  3. საპრიზო ფონდი — რა თქმა უნდა, საპრიზო ფონდიც ერთ-ერთი მნიშვნელოვანი მამოტივირებელია, რადგან, გამარჯვების შემთხვევაში, ის გაძლევს შესაძლებლობას კიდევ უფრო განვითარდე იმ მიმართულებით, რომელიც გაინტერესებს.

"ვფიქრობ, მსგავსი პროექტები ხელს შეუწყობს ამ სფეროს პოპულარიზაციას, მეტ ადამიანს გაუჩნდება ინტერესი და შესაბამისად უფრო მეტად განავითარებს ტექნოლოგიების ამ მიმართულებას", — ამბობს ნიკა მაჭარაძე.

აღსანიშნავია, რომ გუნდებმა გამოწვევაზე მუშაობის პროცესში როგორც ტრადიციული, ასევე ჰიბრიდული მეთოდები და სხვადასხვა ალგორითმები გამოიყენეს, მათ შორის Collaborative Filtering, Content Based Filtering, Deep Learning და სხვ. პროექტის მონაწილეები პროფესიონალი მონაცემთა მეცნიერების მიერ შეფასდნენ, ხოლო მენტორობას მათ საქართველოს ბანკის თანამშრომლები უწევდნენ. აღსანიშნავია, რომ Data Challenge-ის ფარგლებში, მონაწილეებს ეძლევათ შესაძლებლობა, კარიერული განვითარება გააგრძელონ საქართველოს ბანკში.

როგორც საქართველოს ბანკის მონაცემთა კვლევითი ლაბორატორიის ხელმძღვანელი, ირაკლი გოგატიშვილი აღნიშნავს, პროექტის მიმდინარეობისას ჩამოყალიბდა 250-მდე ადამიანისგან შემდგარი კომუნა, რომლის ფარგლებშიც მონაცემთა მეცნიერებით დაინტერესებული ადამიანები ერთმანეთს საკუთარ ცოდნას და გამოცდილებას აქტიურად უზიარებენ.

გვჯერა, ეს ინიციატივა მნიშვნელოვნად შეუწყობს ხელს ქვეყანაში ახალი ტალანტების აღმოჩენას და მონაცემთა მეცნიერების განვითარებას. გვინდა წარმატება ვუსურვოთ პროექტის მონაწილეებს განვითარებისა და აღმოჩენების საინტერესო გზაზე", — ამბობს ირაკლი გოგატიშვილი.

ფოტო: ირაკლი გოგატიშვილი / საქართველოს ბანკი

კიდევ ერთი გამარჯვებული, ზურა ისაკაძე, რომელიც Brain Blinker-ის სახელით გამოწვევაში მარტო მონაწილეობდა, აღნიშნავს, რომ "ასეთი ტიპის გამოწვევები მნიშვნელოვნია და ძალიან შეუწყობს ხელს საქართველოში ამ დარგის განვითარებას. ანალოგიურ საერთაშორისო პლატფორმაზე ყოფილა შემთხვევებიც, როცა გამოწვევის პროცესში სრულიად ახალი ალგორითმი ან მიდგომაც დაბადებულა, რაც ძალიან სასარგებლოა".

ეს პირველი Data Challenge იყო საქართველოში. საინტერესოა, რა გამოცდილება მოუტანა მან ერთი მხრივ საქართველოს ბანკს, რომელმაც კონკურსი დააორგანიზა და ჩაატარა, ხოლო მეორე მხრივ მონაწილეებს. ამ საკითხების უკეთ გასაგებად საქართველოს ბანკის მონაცემთა მეცნიერს, მარიამ არუსტაშვილს ვესაუბრეთ.

რამდენად აქტუალურია დატა ჩელენჯის ამ სერიაში არსებული გამოწვევა თანამედროვე მსოფლიოში? რამდენად უწევდათ მონაწილეებს რეალური პრობლემების გადაჭრა?

პირველი დატა ჩელენჯის გამოწვევა სარეკომენდაციო სისტემის შექმნას ეხებოდა, რაც თანამედროვე მსოფლიოში ერთ-ერთი ყველაზე აქტუალური საკითხია.

ყოველდღიურობაში ძალიან ბევრ და მრავალფეროვან პროდუქტს ვხვდებით, რაც გვირთულებს გადაწყვეტილების მიღებას. სარეკომენდაციო სისტემა კი, ერთი მხრივ, მომხმარებელს უმარტივებს გადაწყვეტილების მიღებას მისთვის ყველაზე საინტერესო შეთავაზებების დაგენერირებით, მეორე მხრივ კი, ბიზნესს ხელს უწყობს, ხმა სწორ სამიზნე აუდიტორიას მიაწვდინოს. ეს კი, საბოლოო ჯამში, ორივე მხარისთვის მნიშვნელოვან ღირებულებას ქმნის.

სარეკომენდაციო სისტემებს მსოფლიოს წამყვანი არაერთი მსხვილი კომპანია იყენებს, მათ შორის: YouTube, Spotify, Netflix, Amazon და ა.შ.

რა მეთოდები გამოიყენეს გუნდებმა მუშაობის პროცესში?

ამოცანაზე მუშაობისას გუნდები ისეთ პროცესებში იყვნენ ჩართული, როგორიცაა მონაცემების დამუშავება, ტრანსფორმაცია, შემდეგ კი მანქანური სწავლების მოდელის აგება და ოპტიმიზაცია.

საუკეთესო შედეგის მისაღებად, მონაწილეებმა არაერთი განსხვავებული ალგორითმი გამოიყენეს, მათ შორის ნეირონული ქსელები, გრაფული ალგორითმები, მატრიცის ფაქტორიზაცია და ა.შ.

საბოლოო ჯამში, სხვადასხვა მეთოდის გამოყენებით გუნდების საბოლოო მიზანს მომხმარებლის გემოვნებასა და ინტერესებზე მორგებული პროდუქტების იდენტიფიცირება და დაგენერირება წარმოადგენდა.

ფოტო: Data Challenge, დაჯილდოების დღე / საქართველოს ბანკი

რა იყო ის მთავარი კრიტერიუმები, რომელთა გათვალისწინებითაც გამარჯვებულები გამოავლინეთ?

მთავარი კრიტერიუმი, რომლითაც პროექტის გამარჯვებულები გამოვავლინეთ F­­beta score იყო — მათემატიკური პარამეტრი, რომელიც პირდაპირ პროპორციულია დაგენერირებული სწორი რეკომენდაციების რაოდენობასთან. ეს იმას ნიშნავს, რომ გუნდები, რომლებმაც მუშაობის პროცესში ალგორითმის გამოყენებით ყველაზე მეტი სწორი რეკომენდაცია შეიმუშავეს, მით უფრო მაღალი ქულა დააგროვეს.

აღნიშნული პარამეტრი წინასწარ იყო ცნობილი მონაწილეებისთვის და სწორედ ამ მეტრიკის ოპტიმიზაციას ცდილობდნენ ისინი. მონაწილეებისთვის ასევე ცნობილი იყო ჩვენს მიერ დადგენილი ე.წ. baseline — ის მინიმალური ზღვარი, რომლის გადალახვაც საჭირო იყო გამარჯვებისათვის.

ამასთან, მონაწილეებს ჩვენთვის უნდა გაეზიარებინათ ალგორითმის კოდი, რომელიც იქნებოდა სტაბილური და ყოველი ახალი მცდელობის შემდგომ, იგივე შედეგს დააგენერირებდა. ფინალურ ეტაპზე კი, მონაწილეებმა საკუთარი მიდგომები და პრობლემის გადაჭრის გზები მენტორებს პრეზენტაციების სახით გაუზიარეს.

რამდენად პერსპექტიულია გამარჯვებული გუნდების პროექტები და უნდა ველოდოთ თუ არა მათ პრაქტიკაში გამოყენებას? რა ეტაპების გავლა იქნება ამისთვის საჭირო?

გამარჯვებულმა გუნდებმა ძალიან საინტერესო პროექტები შემოგვთავაზეს და თამამად შეგვიძლია ვთქვათ, რომ შედეგებმა ჩვენს მოლოდინს გადააჭარბა — მონაწილეებმა დაახლოებით სამჯერ აჯობეს საბაზისო მოდელის ქულას.

რამდენიმე ჩვენთვის საინტერესო და ახალი მიდგომაც ვიხილეთ, რომლის საქართველოს ბანკის მოდელებში დანერგვაც შესაძლოა განხორციელდეს.

ფოტო: საქართველოს ბანკი

ეს იყო საქართველოში პირველი Data Challenge. თქვენი შეფასებით, რა აჩვენა მან? რამდენად დიდია ქვეყანაში მონაცემთა მეცნიერების პოტენციალი?

პირველმა მონაცემთა გამოწვევამ წარმატებით ჩაიარა — პროექტის მიმართ გამოჩენილმა ინტერესმა მიღებულმა შედეგებმა ჩვენს მოლოდინს გადააჭარბა. გამოწვევაში როგორც ინდივიდუალური, ასევე რამდენიმე ადამიანისგან დაკომპლექტებული 125 გუნდი იღებდა მონაწილეობას. მათგან 12-მა გუნდმა მოახერხა მინიმალური ზღვარის გადალახვა.

ჩვენი მიზანია, მსგავსი პროექტებით ხელი შევუწყოთ მონაცემთა მეცნიერების განვითარებასა და პოპულარიზაციას, სფეროთი დაინტერესებული ადამიანების კომუნის გაძლიერებას, რათა მათ უფრო ინტენსიურად შეძლონ იდეებისა და ხედვების გაცვლა და განვითარება.

გვჯერა, ტექნოლოგიები და მათ შორის მონაცემთა მეცნიერება ის სფეროებია, რომელიც ერთ-ერთ წამყვან მიმართულებად შეგვიძლია ვაქციოთ ჩვენს ქვეყანაში. საქართველოს ბანკში სწორედ ამ გზას ვადგავართ", — მარიამ არუსტაშვილი.

მარიამ არუსტაშვილის თქმით, "საქართველოს ბანკისთვის, როგორც საქართველოში ერთ-ერთი უდიდესი ტექნოლოგიური კომპანიისთვის, ყოველთვის პრიორიტეტულია ჩვენს ქვეყანაში მონაცემთა მეცნიერების სფეროს განვითარების ხელშეწყობა და დაინტერესებული ადამიანების წახალისება".

Data Challenge-ების სერიის დაწყებითა და პირველი გამოწვევის წარმატების პირობებში, ბანკს ეს ნამვილად გამოუვიდა. უკვე ვიცით, რა გამოწვევას უმზადებს ბანკი ქართველ მონაცემთა მეცნიერებს მომავალი ჩელენჯისთვის. მანამდე კი ერთ-ერთი გამარჯვებული გუნდის, Pier Piper-ის წევრს, ნიკა მაჭარაძეს ვესაუბრეთ. იმისათვის, რომ უკეთ გაგვეგო რა ხდება მეორე მხარეს — ანუ იმ ადამიანებთან/გუნდებთან, რომლებმაც გამოწვევაში მონაწილეობა მიიღეს, დაძლიეს ის, გაიმარჯვეს და პრაქტიკულად გამოყენებადი პროდუქტი შექმნეს:

როგორი იყო თქვენი გუნდის/წევრების კომპეტენცია და გამოცდილება მონაცემთა მეცნიერების კუთხით და რა შეცვალა Data Challenge-ში მონაწილეობამ?

ჩვენი გუნდი სამი ადამიანისგან შედგება. მე (ნიკა მაჭარაძე) და გიორგი მახარაძე ცოტა ხანია, რაც დავინტერესდით მონაცემთა მეცნიერებით. ნიკა დოღონაძე კი უკვე დიდი ხანია ამ მიმართულებით აქტიურადაა ჩართული სხვადასხვა პროექტებში. ამავე სფეროში აქვს მიუნხენის ტექნიკური უნივერსიტეტის მაგისტრატურა დამთავრებული და ამჟამადაც დასაქმებულია მონაცემთა მეცნიერების მიმართულებით. ამ ჩელენჯში მონაწილეობა, ცხადია, ყველა ჩვენგანისთვის ძალიან საინტერესო გამოდგა, შევიძინეთ ახალი გამოცდილება, წავაწყდით ახალ გამოწვევებს და იმაზე მეტი გავიგეთ ამ პრობლემების შესახებ, ვიდრე აქამდე წარმოგვედგინა.

მოგვიყევით თქვენს პროექტზე. რა გადაწყვეტა მოუძებნა თქვენმა გუნდმა გამოწვევას და რამდენად პრაქტიკულად მიგაჩნიათ ის?

პროექტის მიზანი იყო მომხმარებლების ქცევიდან გამომდინარე გაგვეკეთებინა სარეკომენდაციო სისტემები მათთვის, რაც გულისხმობს იმას, რომ ადამიანების მიერ გაკეთებულ ტრანზაქციებზე დაყრდნობით განგვესაზღვრა მომავალში რისი შეძენა შეიძლება სურდეთ მათ. ჩვენმა გუნდმა, მრავალი მცდელობის შემდეგ, მანქანური სწავლებისა (ML) და ხელოვნური ინტელექტის (AI) დახმარებით, შეძლო პრობლემის ამოხსნის ისეთი გზის მოძებნა, რაც საბოლოოდ გამოწვევაში გაგვამარჯვებინებდა.

რა ახალი შესაძლებლობები/გამოცდილება მოგიტანათ გამოწვევაში მონაწილეობამ?

გამოწვევაში მონაწილეობამ, ცხადია, უფრო მეტად დაგვაკავშირა ერთმანეთს გუნდის წევრები, მიუხედავად იმისა, რომ აქამდეც ძალიან ახლო მეგობრები ვიყავით. გარდა ამისა, გაგვიჩნდა სხვა კონკურსებში მონაწილეობის მიღების ინტერესი და მოტივაცია. დავალებაზე მუშაობის დროს კი გავეცანით სხვადასხვა სარეკომენდაციო სიატემების ალგორითმებს, განვიხილეთ მრავალი სტატია, სამეცნიერო ნაშრომი და შემდეგ ეს ყველაფერი დავუკავშირეთ საქართველოს ბანკის გამოწვევას. ვფიქრობთ, რომ მიღებულ გამოცდილებას მომავალ საქმიანობაშიც გამოვიყენებთ.

როგორია თქვენი პროექტის ან გუნდის სამომავლო პერსპექტივა? არის თუ არა შანსი, რომ მან პრაქტიკული გამოყენება ჰპოვოს? თუ კი, რა ეტაპების გავლას გეგმავთ ამისთვის?

ჩვენი აზრით, ამ იდეას, რა თქმა უნდა, დიდი პერსპექტივა აქვს მომავალში, რადგან ხშირად მომხმარებლებისთვის ძალიან მნიშვნელოვანია ინდივიდუალური შეთავაზებების გაკეთება. Data challenge-ის ორგანიზატორებთან საუბრის შემდეგ გაირკვა, რომ სარეკომენდაციო სისტემის დანერგვა იგეგმება და სწორედ ამიტომ ჩატარდა ეს კონკურსი, თუმცა ჩვენი ამოხსნის ექსპლუატაციაში ჩაშვებამდე, საჭიროა გარკვეული დეტალების დამუშავება და მონაცემებზე უფრო ზუსტად მორგება, რადგან გამოწვევაში მონაწილე გუნდებისთვის მომხმარებლებისა და “მერჩანტების” გარკვეული ინფორმაცია სრულად არ იყო მოცემული. ჩვენს გუნდს რაც შეეხება, ვაპირებთ Data challenge-ის შემდეგ ეტაპზეც მივიღოთ მონაწილეობა და ვეცადოთ გამარჯვებას.


Data Challenge-ების სერია, რა თქმა უნდა, გაგრძელდება. გამოწვევაში მონაწილეობის მიღება ნებისმიერ მსურველს შეუძლია, რომელიც სწავლობს ან დასაქმებულია კომპიუტერული მეცნიერებების, მათემატიკის, ფიზიკის ან ეკონომიკის სფეროში. როგორც მარიამ არუსტაშვილი ამბობს, მომავალი გამოწვევა შემოდგომაზე დაანონსდება, რომლის შემდეგაც კიდევ უფრო დიდ დაინტერესებასა და ჩართულობას ელოდებიან. მარიამის თქმით, უკვე ცნობილია შემდეგი ჩელენჯის თემა. ეს ენისა და მეტყველების ტექნოლოგიებია.