როგორ შექმნა ჩინეთმა პირბადიანი სახეების ამომცნობი ალგორითმი
სახის ამომცნობი ტექნოლოგიების კომპანია Hanwang, რომელიც სათვალთვალო კამერების და შესაბამისი პროგრამული ტექნოლოგიების წარმოებით მსოფლიო ბაზარზეა ცნობილი, კორონავირუსთან საბრძოლველად ჯერ კიდევ იანვარში მოემზადა.
ჰუა ლეი, კომპანიის მთავარი ტექნიკოსი განმარტავს, რომ მანამდე, სანამ ვირუსი მსოფლიოში გავრცელდებოდა, ჰუბეის პროვინციაში მდებარე საავადმყოფოები მათ სისტემების განახლებას სთხოვდნენ, რათა ნიღბებიანი ექთნების ამოცნობა შესაძლებელი გამხდარიყო.
ნელ-ნელა კი პოლიციის, სარკინიგზო სადგურების და სხვადასხვა კომპანიის მხრიდან მსგავსი პროგრამული უზრუნველყოფის მოთხოვნა კიდევ უფრო გაიზარდა.
კომპანიის თქმით, მათ მიერ მოთხოვნის საფძველზე შექმნილმა ნიღბიანი სახის ამომცნობმა სისტემამ ლაბორატორიულ ცდებში სიზუსტის 95 პროცენტს მიაღწია, რეალურ ცხოვრებაში კი, მათი თქმით, სიზუზტის მაჩვენებელი ბევრად მაღალია, რადგან კამერას პიროვნებისთვის ერთის ნაცვლად რამდენიმე ფოტოს გადაღება შეუძლია.
"ნიღბიანი სახეების ამოცნობის პრობლემა ახალი არაა", — განაცხადა ლეიმ. მისი თქმით, კომპანია მსგავს მოთხოვნას პირველად თურქეთსა და პაკისტანში წააწყდა, ასევე ჩინეთის ჩრდილოეთში, სადაც სიცივის გამო ადამიანები სახის გარკვეულ ნაწილს ხშირად იფარავენ.
ინტუიციის საპირისპიროდ, ნიღბიანი სახეების ამომცნობი ალგორითმის შექმნისას მეცნიერებს გარკვეული მონაცემების "გადაყრა" დასჭირდათ. ბრედფორდის უნივერსიტეტის მკვლევრებმა გასულ წელს გამოაქვეყნეს ნაშრომი, სადაც ახსნილი იყო, რომ მსგავსი სისტემის შექმნისთვის მათ AI-ს საწრთვნელ მონაცემთა ბაზაში არსებული ფოტოების "სახის ქვემოთ გადაჭრა" მოუწიათ.
როდესაც სახის ამომცნობი პროგრამა პიროვნების იდენტიფიცირებას ცდილობს, იგი ჯერ ამოსაცნობი ობიექტის ფოტოს იღებს და მას რიცხვებად გარდაქმნის, რომლებიც სახის სხვადასხვა მახასიათებლის პოზიციას შეესაბამება.
თუმცა, როდესაც ალგორითმი დიდ პოპულაციასთან მიმართებაში გამოიყენება, იზრდება იმის შანსი, რომ პროგრამამ ნიღბიანი სახე არასწორად ამოიცნოს. ამის მიზეზი ისაა, რომ მთლიან სახესთან შედარებით, ნახევარი სახიდან ამოღებული მონაცემები მწირია. მეტია იმის შანსიც, რომ თვალებისა და ცხვირის გარშემო არსებული მახასიათებლები ბევრ ადამიანში მსგავსი იყოს.
მისტერ ჰუას თქმით, კომპანიის მიერ შექმნილი ახალი ალგორითმი შენობაში, ოფისის მსგავს გარემოში მუშაობისთვისაა გათვლილი და ყველაზე ეფექტური მაშინაა, თუ მის ბაზაში ამოსაცნობი ადამიანების რაოდენობა 50 000-ს არ სცდება. ის ჩინეთის პოლიციის მონაცემთა ბაზის დახმარებით შეიქმნა, რომელიც 1,2 მილიარდ ფოტოს შეიცავს.
კომპანიის ალგორითმი შემდეგნაირად მუშაობს: ის ცდილობს გამოიცნოს, როგორი შესახედი იქნებოდა მის მონაცემთა ბაზაში არსებული ფოტოები (ჯამში 1,2 მილიარდი), თუ მათზე გამოსახულ ადამიანებს ნიღბები ეკეთებოდათ. შემდეგ კი ამ "ცოდნაზე" დაყრდნობით ის კამერებზე აღბეჭდილი ადამიანების ამოცნობას ცდილობს. ალგორითმის გასაწრთვნელად კომპანიამ ასევე შექმნა 6 მილიონი ფოტოს შემცველი ბაზა, სადაც ადამიანებს სახეებზე ნიღბები ხელოვნურად ჰქონდათ გენერირებული.
სახის ამომცნობი სისტემების გამოცდა სხვადასხვა ქვეყანაში აქტიურად მიმდინარეობს. როდესაც ჰუას ჰკითხეს, რომ მისი პროგრამა, შესაძლოა, ჰონგ-კონგის პროტესტებში მონაწილეთა ამოსაცნობად გამოეყენებინათ, ჰუამ ახსენა, რომ მას რეგიონში "ანტი-ტერორისტული ხელსაწყოების" საჭიროების შესახებ ჰქონდა გაგებული.
ჰუამ განაცხადა, რომ მისი სისტემა ძირითადად საოფისე საქმიანობისთვისაა განკუთვნილი.
"ჰონგ-კონგის მოვლენებისთვის განკუთვნილ ალგორითმზე ბაზარზე მოთხოვნა არ არის", — ამბობს ის.
კომენტარები