მეცნიერებმა ინოვაციური სპიკერი შექმნეს, რომელსაც შეუძლია, ოთახში სხვადასხვა ხმა ამოიცნოს და განსაზღვროს, საიდან მოდის ისინი. ამას იგი 7 პატარა მიკროფონ-რობოტის მეშვეობით ახერხებს.

მეტიც, კვლევის ავტორები იმასაც ამტკიცებენ, რომ ლოკალიზაცია მათ არამხოლოდ საუბრების გაცალკევების, არამედ ხმაურიანი ზონების — ან გამაღიზიანებელი ხალხის — დადუმების საშუალებასაც იძლევა სურვილისამებრ. შესაძლოა, ეს ვიდეოკონფერენციების ან შეხვედრების დროს აღმოჩნდეს გამოსადეგი.

ნაშრომი ჟურნალში Nature Communications გამოქვეყნდა.

სპიკერი "რობოტების არმიისგან" შედგება, რომელშიც თითოეული რობოტი პატარა მიკროფონია. ისინი ერთმანეთთან ინტერაქციაში შედის, პატარ ბორბლებზე ავტონომიურად გადაადგილდება და საჭიროების შემთხვევაში სპეციალურ სადგურს უბრუნდება დასატენად. მათი მეშვეობით მკვლევრებმა ოთახში რამდენიმე ადამიანის ხმის ლოკალიზება და მათი ნასაუბრების გამოცალკევება შეძლეს.

გარემოში ნავიგაციისთვის თითოეული ბოტი მაღალსიხშირული ექოლოკაციის მსგავს ტექნიკას იყენებს.

მოწყობილობაში მოძრაობის უნარი განსაკუთრებით მნიშვნელოვანია. მიკროფონების რაც შეიძლება დიდ მანძილზე გაფანტვით მონაცემების გადამამუშავებელ ნეირონულ ქსელს შეუძლია, მეტად ზუსტი გამოთვლები გააკეთოს. ამჟამად რობოტებს მხოლოდ 2D სივრცეში შეუძლია ლოკალიზება.

"ნეირონული ქსელები შევქმენით, რომლებიც ამ დროში შეყოვნებული სიგნალების გამოყენებით თითოეული ადამიანის ნათქვამს აცალკევებს და მათ მდებარეობებს განსაზღვრავს სივრცეში", — განმარტავს კვლევის თანაავტორი ტუოჩაო ჩენი — "შესაბამისად, როცა ოთხი ადამიანი ლაპარაკობს და ორი სხვადასხვა დიალოგია, შეგიძლიათ, ოთხიდან ნებისმიერი ხმა გამოაცალკეოთ და გაიგოთ, საიდან მოდის იგი".

თავისთავად, მკვლევართა მტკიცებები ექსპერიმენტების შედეგებიდან გამომდინარეობს.

მკვლევრებმა რობოტების გუნდი ოფისებისა და სამზარეულოების მსგავს ადგილებში შეამოწმეს. ექსპერიმენტის მიმდინარეობისას 3-5 ადამიანი ლაპარაკობდა. სისტემას წინასწარ არც ადგილმდებარეობა სცოდნია და არც ხმები.

მიუხედავად დაბრკოლებებისა, მოწყობილობამ დროის 90 პროცენტში მაინც შეძლო ხმების ლოკალიზება, მაქსიმალური აცდენა კი დაახლოებით 49 სანტიმეტრს შეადგენდა. საშუალო აცდენა, თავის მხრივ, ყველა სცენარში მაქსიმუმ 15 სანტიმეტრი იყო, რაც საკმაოდ მცირეა.

მიუხედავად ამ ყველაფრისა, მოწყობილობა საკმაოდ ნელია — სისტემას 3-წამიანი ხმის გადასამუშავებლად საშუალოდ 1.82 წამი სჭირდება. შესაბამისად, ვიდეოკონფერენციების დროს იგი შეიძლება მოუხერხებელი აღმოჩნდეს.

სამომავლოდ მკვლევრებს სურთ, დადუმებისა და განცალკევების ტექნიკები ფიზიკურ გარემოში გამოიყენონ რეალურ დროში. მათ მიკროფონების მეშვეობით ისეთივე ეფექტის მიღწევა სურთ, როგორსაც ხმის დამხშობი ყურსასმენები გვთავაზობს, თუმცა მთლიანი ოთახის შემთხვევაში.

თუ სტატიაში განხილული თემა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ტექნოლოგიებზე.