გარღვევა ხელოვნური ინტელექტის სფეროში — ეს AI სურათებს მხოლოდ ტექსტური აღწერისგან აგენერირებს
ხელოვნური ინტელექტი სამყაროს აღქმას კიდევ ერთი ნაბიჯით მიუახლოვდა
გინახავთ თეთრი დათვი, რომელიც გიტარაზე უკრავს? ან თეთრ ცხენზე ამხედრებულ ასტრონავტისთვის თუ მოგიკრავთ თვალი? პიკასოს მიერ დახატულ რობოტზე რას იტყვით? ან ნებისმიერ ისეთ, თუნდაც აფსურდულ გამოსახულებაზე, რომელიც თქვენს წარმოსახვაში გაჩნდა, მაგრამ დახატვა არ შეგიძლიათ. თუ ახალ ხელოვნურ ინტელექტს ასეთ ვიზუალებს ტექსტურად აღუწერთ, ის მას გაიგებს და დახატავს.
ილონ მასკის თანადაფუძნებული კომპანია OpenAI, რომელსაც Microsoft-იც უჭერს მხარს, Dota 2-ის თამაშში და ყალბი ამბების წერაში უკვე დახელოვნებულია. ახლა კი მან კიდევ ერთ მიზანს მიაღწია — კომპანიის ხელოვნური ინტელექტის აპლიკაცია DALL-E 2 სურათებს ნებისმიერ აღწერაზე დაფუძნებით ქმნის. მაგალითად, თუ აპლიკაციაში "ცხენზე ამხედრებულ ასტრონავტს", ან "სუშისგან დამზადებულ კატას" მიუთითებთ, ის საპასუხოდ შემდეგ მაღალი ხარისხის სურათებს მოგაწვდით:
აპლიკაცია ობიექტის სურათს მისი მახასიათებლების — ფორმის, ფერის და ა.შ. საფუძველზე ქმნის. გარდა ამისა, მას სურათის რამდენიმე ობიექტის კომბინაციით შექმნაც შეუძლია. ადრინდელი text-to-image პროგრამებისგან განსხვავებით, იგი პროდუქტს ისეთ დეტალებსაც ამატებს, რომლებიც აღწერაში საერთოდ არაა აღნიშნული, თუმცა რეალისტური სურათის შესაქმნელადაა საჭირო. მაგალითად, როდესაც "ზამთარში მინდორში მჯდომარე მელიას ნახატი" მიუთითეს, DELL-E 2-მა თვითონვე განსაზღვრა, რომ ცხოველს ჩრდილიც დასჭირდებოდა.
"ნულოვანი მსჯელობის" უნარის გამოყენებით, ხელოვნური ინტელექტი აღწერაზე დაფუძნებით პასუხს ნებისმიერი დამატებითი მომზადების გარეშე აგენერირებს. მას აქამდე თარგმნისთვის და სხვა სამუშაოებისთვის იყენებდნენ, ახლა მკვლევრებმა ეს AI ვიზუალურ დომენს მოარგეს. მათი მიზანი ხელოვნური ინტელექტისთვის როგორც image-to-image, ასევე text-to-image თარგმნის სწავლება იყო. ერთ შემთხვევაში აპლიკაციამ ზუსტად ისეთი კატის მაღალი რეზოლუციის სურათი შექმნა, როგორიც ესკიზზე იყო გამოსახული.
ყველა სიკეთესთან ერთად, DALL-E 2 სურათებს ფოტოგრაფიულ, ანიმაციურ, clip-art და ფერწერულ სტილშიც ქმნის. ამ უკანასკნელის გენერირება მას ხელოვნების რომელიმე კონკრეტული მიმდინარეობის, მაგალითად, კუბიზმის სტილშიც შეუძლია.
აღსანიშნავია, რომ DALL-E 2 სურათებს ყოველთვის ასეთი წარმატებით ვერ ქმნის. ხანდახან იგი იმას აგენერირებს, რაც მკვლევრებს უნდათ, ზოგ შემთხვევაში კი რაღაც უცნაურ არეულ სურათებს იღებს. როგორც სხვა AI სისტემების შემთხვევაში, ახლაც, მკვლევრებს ზუსტად და ბოლომდე არ ესმით, თუ როგორ ხდება ეს.
შემდგომი განვითარების შემთხვევაში DALL-E-ის აქვს პოტენციალი, ისეთი სფეროები მოიცვას, როგორიც ილუსტრაციების შექმნა და stock ფოტოგრაფიაა.
კომენტარები