შეიმუშავეს ახალი ალგორითმი, რომელიც უნივერსიტეტის დონის რთულ მათემატიკურ ამოცანებს ხსნის
ალგორითმი ამოცანების ამოხსნის გარდა თვისობრივად ახალ კითხვებსაც აგენერირებს
მრავალცვლადიანი კალკულუსი, დიფერენციალური განტოლებები, წრფივი ალგებრა — თემები, რომელთა ამოხსნაც MIT-ის სტუდენტებს მარტივად შეუძლიათ — მუდმივად გამოწვევა იყო მანქანური სწავლების მოდელებისთვის. საკეთესო მოდელებს მხოლოდ ელემენტარულ ან სკოლის მაღალი კლასის კითხვებზე შეეძლოთ პასუხის გაცემა და ამ შემთხვევაშიც ყოველთვის ვერ იღებდნენ სწორ პასუხს.
ახლა მეცნიერთა მულტიდისციპლინარულმა გუნდა MIT-ის პროფესორის, იდდო დრორის ხელმძღვანელობით გამოიყენა ნეირონული ქსელის მოდელი, რათა უნივერსიტეტის დონის მათემატიკური ამოცანები ადამიანის მსგავსად ამოეხსნათ.
ეს მოდელი ავტომატურად ხსნის პასუხების მიღების წესს და ასევე მსგავსი სირთულის სხვა ამოცანებსაც აგენერირებს. როდესაც მკვლევრებმა მანქანის მიერ დაგენერირებული ამოცანები უნივერსიტეტის სტუდენტებს აჩვენეს, მათ ვერ გაარჩიეს, ეს ადამიანის შედგენილი იყო, თუ — ალგორითმის.
ეს AI შეგვიძლია, გამოვიყენოთ დიდი კურსებისთვის შესაბამისი კონტენტის გენერაციისთვის. სისტემამ შეიძლება, ავტომატური ტუტორის როლიც მოირგოს და სტუდენტებს აჩვენოს პასუხის მიღების გზები და მეთოდები.
"ჩვენ ვფიქრობთ, რომ ეს გააუმჯობესებს უმაღლეს განათლებას", — ამბობს დრორი. "ის სტუდენტებს საკუთარი შესაძლებლობების გაუმჯობესებაში, ხოლო პედაგოგებს ახალი კონტენტის შექმნაში დაეხმარება, რაც საბოლოო ჯამში კურსის ეფექტურობას გაზრდის. ეს ალგორითმი ასევე მოგვაწვდის შესაბამის მონაცემებს, რათა კითხვებისა და კურსების გრაფიკი ავაგოთ და უკეთ დავინახოთ კურსებისა და პრე-რეკვიზიტების ურთიერთდამოკიდებულება.
ეს სამუშაო არის MIT-ის, ჰარვარდის, კოლუმბიისა და ვატერლოოს უნივერსიტეტების სტუდენტების, მკვლევრების და აკადემიური პერსონალის კოლაბორაციის შედეგი. კვლვევა ამ კვირაში Proceedings of the National Academy of Sciences-ში გამოქვეყნდა.
"ევრიკას" მომენტი
დრორი და მისი სტუდენტები ამ პროექტზე ორი წლის მანძილზე მუშაობდნენ. მათ აღმოაჩიეს, რომ ის მოდელები, რომლებიც მხოლოდ ტექსტებზე იყვნენ წინასწარ დატრენინგებულნი, მხოლოდ 8%-იანი სიზუსტით ხსნიდნენ მაღალი კლასის მათემატიკის ამოცანებს, ხოლო ის მოდელები, რომლებიც ნეირონულ ქსელს ეფუძნებოდნენ, მანქანური სწავლების კურსის კითხვებს წამში სცემდნენ პასუხს. თუმცა ამ უკანასკნელის გადამზადებას ერთი კვირა სჭირდებოდა.
შემდეგ დრორის ჰქონდა, რაღაც, რასაც ის "ევრიკას" მომენტს ეძახის: მან აიღო MIT-ისა და კოლუმბიის უნივერსიტეტის მათემატიკის კურსის ის ამოცანები, რომლებსაც ეს მოდელები არ იცნობდნენ და პროგრამული სინთეზისა და FSL-ს (few-shot learning გულისხმობს ობიექტის კატეგორიზაციის ალგორითმის გავარჯიშებას ერთ ან რამდენიმე მაგალითზე დაყრდნობით. ცნობისათვის, უმეტესი AI-ზე დაფუძნებული მსგავსი ალგორითმების გავარჯიშება ათასობით მაგალითზე ხდება) ტექნიკების გამოყენებით გადააქცია პროგრამულ დავალებებად. კითხვის პროგრამულ დავალებად გადაქცევა ისეთივე მარტივია, როგორც საკითხის "ოპოვეთ ორ წერტილს შორის მანძილის" გადაწერა შემდეგნაირად — "დაწერეთ პროგრამა, რომელიც იპოვის განსხვავებას ორ წერტილს შორის" ან მაგალითის სახით რამდენიმე საკითხი-პროგრამის წყვილის უზრუნველყოფა.
სანამ ამ პროგრამული დავალებებით ნეირონულ ქსელს "გამოკვებავდნენ", მკვლევრებმა სიახლეც დაუმატეს მას, რითიც მან წინა მოდელები გადაჯაბნა.
უწინ მსგავს საკითხებზე მუშაობისას მეცნიერები იყენებნენ GPT-3 ნეირონულ ქსელს, რომელიც წინასწარ მხოლოდ ტექსტებზე იყო ნავარჯიშევი, რაც ნიშნავს, რომ მას ტექსტების მილიონობით მაგალითს აჩვენებდნენ, რათა მას ბუნებრივი ენის პატერნები დაესწავლა. ამ შემთხვევაში მათ ისეთი ნეირონული ქსელი გამოიყენეს, რომელიც წინასწარ ისეთ ტექსტებზე ავარჯიშეს, რომლებიც კოდებზეც იყვნენ "დაშენებულნი" ("fine-tuned"). ეს ქსელი, სახელად Codex, OpenAI- მა გამოუშვა. დაშენება, ზუსტად მორგება წინასწარი გავარჯიშების მნიშვნელოვანი სიახლეა, რომელმაც მანქანური სწავლების მოდელი გააუმჯობესა.
წინასწარ გადამზადებულ მოდელს აჩვენეს ონლაინ რეპოზიტორებიდან ამოღებული მილიონობით კოდი. გამომდინარე იქიდან, რომ ამ მოდელის სავარჯიშო მონაცემები მოიცავდა როგორც ბუნებრივი ენის მილიონობით სიტყვას, ისე კოდების მილიონობით სტრიქონს, ამიტომ ის სწავლობს ტექსტების მონაკვეთებისა და კოდების ნაწილების ურთიერთკავშირს.
დრორი ხსნის, რომ ბევრი მეთემატიკური ამოცანა შეიძლება, ამოიხსნას კომპიუტერული გრაფიკით ან ხით, თუმცა ამ ტიპის რეპრეზენტაციად რთულია ტექსტად დაწერილი ამოცანის გადაქცევა. გამომდინარე იქიდან, რომ ამ მოდელმა შეისწავლა ტექსტისა და კოდის ურთიერთდამოკიდებულება, ამიტომ მას შეუძლია, რამდენიმე საკითხი-კოდის მაგალითზე დაყრდნობით, ტექსტური კითხვა კოდად გადააქციოს და შემდეგ კოდის მართვით ამოხნსნას ამოცანა.
"როდესაც კითხვას მხოლოდ ტექსტის სახით კითხულობთ, პასუხის პოვნა მანქანური სწავლების მოდელისთვის რთულია, მიუხედავად იმისა, რომ პასუხი შეიძლება საკუთრივ ტექსტშივე იყოს", — ამბობს ის. "ეს ინოვაცია ავსებს იმ სივრცეს, რომელიც კოდისა და პროგრამული სინთეზის გამოყენებას შორის არსებობდა".
ეს არის პირველი მოდელი, რომელიც ბაკალავრიატის დონის მათემატიკის ამოცანებს ხსნის და თან სიზუსტეს 8%-დან 80%-მდე ზრდის, ამობს დრორი.
კონტექსტის დამატება
მათემატიკური საკითხის პროგრამულ დავალებად გადაქცევა არაა ყოველთვის მარტივი, ამბობს დრორი. ზოგი ამოცანა მეცნიერებისგან კონტექსტის დამატებას მოითხოვს, რათა ნეირონულმა ქსელმა შეძლოს კითხვის სწორად გააზრება. სტუდენტი თავის გამოცდილებას დაეყრდნობა მსგავსი ამოცანების ამოხსნისას, მაგრამ ნეირონულ ქსელს გარედან დამატებამდე არ აქვს ეს ცოდნა.
მაგალითად, მათ შეიძლება, დასჭირდეთ დაზუსტება, რომ "ქსელი" კითხვის ტექსტში ეხება "ნეირონულ ქსელს" და არა "საკომუნიკაციო ქსელს". ან შეიძლება, მათ დასჭირდეთ მოდელისთვის იმის მითითება, თუ რომელი პროგრამული პაკეტი გამოიყენონ. მათ შესაძლოა, წინასწარ გარკვეული განსაზღვრებების დამატებაც დასჭირდეთ: მაგალითად, კითხვაში პოკერის კომბინაციის შესახებ მათ მოუწევთ იმის ახსნა, რომ თითიეული დასტა 52 კარტს შეიცავს.
მკვლევრებმა ეს მოდელი ახალი მათემატიკური კითხვებისა და ამოცანების გენერირებისთვისაც გამოიყენეს. მათ მოდელი ერთსა და იმავე თემაზე რამდენიმე მაგალითით "გამოკვებეს" და შემდეგ მსგავს თემაზე სხვა ამოცანის გენერირება დაავალეს.
"ზოგიერთ თემაზე მოდელმა გაგვაოცა. მაგალითად, ვერტიკალური და ჰორიზონტალური ხაზების კვანტურ დეტექციაზე დაყრდნობით მან დააგენერირა კითხვები ჰორიზონტალური ხაზების კვანტურ დეტექციაზე. ასე რომ, ეს არ არის კითხვების დაგენერირება ცვლადების უბრალო შეცვლით თუ განაცვლებით", — ამბობს დრორი.
ადამიანის დაგენერირებული vs მანქანის დაგენერირებული კითხვები
მკვლევრებმა მანქანის მიერ დაგენერირებული კითხვები უნივერსიტეტის სტუდენტებისთვის ჩვენებით გამოსცადეს. მათ სტუდენტებს ბაკალავრიატის მათემატიკის კურსიდან 10 კითხვა დაუსვეს — 5 ადამიანის მიერ იყო შედგენილი და 5 რობოტის დაგენერირებული იყო.
სტუდენტებს არ შეეძლოთ ადამიანისა და ალგორითმის მიერ შექმნილი კითხვების ერთმანეთისგან გარჩევა და მათ ორივეს სირთულისა და კურსთან შესაბამისობის მიხედვით ერთნაირი შეფასებები დაუწერეს.
დრორი აქვე აღნიშნავს, რომ ეს ინოვაცია არ ისახავს მიზნად, ადამიანი პროფესორები ჩაანაცვლოს.
"ავტომატიზაცია ახლა 80%-ზეა, მაგრამ ის ვერასდროს იქნება 100%-ით ზუსტი. ყოველ ჯერზე, როდესაც რაღაცას ხსნით, ვიღაცამ შეიძლება, უფრო რთული კითხვა მოიფიქროს. ეს ინოვაცია გვაძლევს შესაძლებლობას, რომ მანქანური სწავლებით უფრო და უფრო რთული ამოცანები ამოვხსნათ. ჩვენ ვფიქრობთ, რომ მას დიდი გავლენა ექნება უმაღლეს განათლებაზე", — ამბობს ის.
გუნდი საკუთარი მიდგომის წარმატებით აღფრთოვანებულია და ახლა სურს, ეს სიახლე მათემატიკურ დამტკიცებებზეც განავრცოს, თუმცა აქ არის გარკვეული სირთულეები, რომელთა მოგვარებასაც ისინი გეგმავენ. ამჟამად ამ მოდელს არ შეუძლია უპასუხოს კითხვებს, რომლებიც ვიზუალურ კომპონენტს შეიცავენ და ვერ ხსნის ამოცანებს, რომელთა დამუშავებაც, მართვაც კომპიუტერულად საკმაოდ რთულია.
კომენტარები