ინდოეთში მდებარე ველორეს ტექნოლოგიური ინსტიტუტის სტუდენტმა, პრიანჯალი გუფთამ შექმნა ხელოვნური ინტელექტის მოდელი, რომელიც ამერიკულ ჟესტურ ენას "კითხულობს" და მას რეალურ დროში ინგლისურ სიტყვებად აქცევს.

მონაცემთა ახალგაზრდა მეცნიერმა საკუთარი ძალების ინკლუზიურ ტექნოლოგიაში გამოცდა თებერვალში გადაწყვიტა, რის შემდეგაც ალგორითმზე დაიწყო მუშაობა. ამისთვის მან პროგრამული ბიბლიოთეკის TensorFlow ობიექტის ამომცნობი ინტერფეისი გამოიყენა. ასევე, ვებკამერით გადაღებული სურათების მეშვეობით, ჟესტებს სათანადო მნიშვნელობა შეუსაბამა, როგორიცაა: "გამარჯობა", "მე შენ მიყვარხარ", "გმადლობ", "დიახ", "არა" და "გთხოვ".

ხელოვნური ინტელექტის ეს მოდელი ამჟამად მხოლოდ ცალკეულ კადრებზეა მორგებული, ვიდეოების ამოცნობის უზრუნველყოფას კი პრიანჯალი გუფთა რეკურენტული ნეირონული ქსელის LSTM დახმარებით გეგმავს, რისთვისაც ის კვლევებს უკვე აწარმოებს. კომპიუტერულ მეცნიერებათა სპეციალისტი აღიარებს, რომ დასახული მიზნის მიღწევა საკმაოდ რთული იქნება, თუმცა სჯერა, რომ, ადრე თუ გვიან, ეს აუცილებლად გამოუვა.

მნიშვნელოვანია, რომ პანდემიის გამო ონლაინ კომუნიკაციაზე გადასვლამ ჟესტების ენასთან დაკავშირებული პრობლემები გამოკვეთა. კომპანიებმა დაიწყეს ისეთი ალგორითმების შემუშავება, რომლებიც ამ დაბრკოლებების გადალახვას ემსახურება. მაგალითად, Google-მა წარადგინა მოდელი, რომელიც ჟესტების ენას ხელების სხვა მოძრაობებისგან 91-პროცენტიანი სიზუსტით მიჯნავს.

გუფთას განცხადებით, დეველოპერები გამოსავლის მოსაძებნად ყველაფერს აკეთებენ, თუმცა პირველი ნაბიჯი ამ ენის ნორმალიზება უნდა იყოს.

თუ სტატიაში განხილული თემა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ტექნოლოგიებზე.