Google-მა 2025 წლის დეველოპერულ კონფერენციაზე Veo 3-ის გაშვების შესახებ გამოაცხადა. ეს ხელოვნურ ინტელექტზე (AI) დაფუძნებული ხელსაწყოა, რომელიც ვიდეოსა და ხმას ქმნის, შემდეგ კი მათ ბუნებრივად აერთებს. ახალი ინსტრუმენტი OpenAI-ის ვიდეოგენერატორ Sora-ს კონკურენტია, თუმცა, მისგან განსხვავებული ფუნქციებიც აქვს. მაგალითად, აუდიოს, მათ შორის პერსონაჟებს შორის დიალოგებისა და ცხოველთა ხმების, ვიდეოში ჩასმა შეუძლია. კომპანიის ინფორმაციით, ახალი მოდელი წინასთან შედარებით უკეთესი ხარისხის მასალას გვთავაზობს.

ფოტო: Generative AI

"Veo 3 გამოირჩევა იმით, რომ ტექსტისა და სურათების მიხედვით ბუნებრივ ვიდეოებს ქმნის. ფიზიკის კანონების გათვალისწინებით, ის ტუჩების მოძრაობას ხმას ზუსტად აყოლებს", — თქვა Google DeepMind-ის პროდუქტის ვიცე-პრეზიდენტმა, ელი კოლინსმა, სამშაბათს.

AI ინსტრუმენტი აშშ-ში Google-ის ახალი პაკეტის მომხმარებლებისთვის სამშაბათიდან უკვე ხელმისაწვდომია. გამოწერა თვეში 249.99 დოლარი ღირს და AI-ის მოყვარულებზეა გათვლილი. Veo 3 ხელმისაწვდომი იქნება Google-ის კორპორაციული პლატფორმა Vertex AI-ის მომხმარებლებისთვისაც.

"უხმო ვიდეოგენერაციის ეპოქიდან პირველად გავდივართ", — აღნიშნა Google DeepMind-ის დამფუძნებელმა, დემის ჰასაბისმა, პრესკონფერენციაზე — "შეგიძლიათ, პერსონაჟები, გარემო და დიალოგის იდეა აღწეროთ. ასევე დააზუსტოთ, როგორ გსურთ, რომ ის ჟღერდეს".

Google-მა ასევე Imagen 4-იც წარადგინა, რომელიც გამოსახულების შექმნის უახლესი ინსტრუმენტია. კომპანიის თქმით, ის მომხმარებლის ტექსტობრივი აღწერის საფუძველზე უფრო მაღალი ხარისხის სურათებს ქმნის. გარდა ამისა, კომპანიამ Flow, ფილმების შესაქმნელი ახალი სისტემაც გამოუშვა. ადამიანები აღწერენ ლოკაციებს, კადრებს, ნებისმიერ სასურველ დიზაინს და ამ მონაცემებზე დაყრდნობით კინემატოგრაფიულ ვიდეოებს შექმნიან. Flow-ზე წვდომა Gemini-ის, Whisk-ის, Vertex AI-ისა და Workspace-ის მომხმარებლებს ექნებათ.

Imagen 4-ის მიერ შექმნილი ფოტო.

ფოტო: Generative AI Publication

რა თქმა უნდა, მსგავსი ინსტრუმენტი ახალი არაა. სტარტაპები (Runway, Lightricks, Genmo, Pika, Higgsfield, Kling და Luma) და ტექნოლოგიური გიგანტები (OpenAI და Alibaba) ახალ მოდელებს სწრაფად უშვებს. ხშირად ისინი ერთმანეთისგან დიდად არ განსხვავდება. იმ შემთხვევაში, თუ Google თავის დაპირებას შეასრულებს და აუდიოგენერაციის ფუნქცია გამართულად იმუშავებს, ეს სხვა მოდელებს შორის მთავარი განმასხვავებელი გახდება.

ახალი პროდუქტები მაშინ ჩაეშვა, როცა ხელოვნურ ინტელექტზე დაფუძნებული ვიდეოგენერატორები უფრო და უფრო პოპულარული ხდება. მარტში OpenAI-ის დამფუძნებელმა, სემ ალტმანმა განაცხადა, რომ ChatGPT-ის მოდელში, GPT-4o-ში, ჩაშენებული სურათების გენერატორი იმდენად პოპულარული გახდა, რომ კომპანიის ჩიპები "დნებოდა". იმავე პერიოდში ამ ფუნქციის გამოყენება დროებით შეიზღუდა.

სურათების გენერირების სფეროში შერეულია Google-ის გამოცდილება ერთგვაროვანი არაა. გასულ წელს კომპანიამ Imagen 3 ხელახლა გამოუშვა მას შემდეგ, რაც სისტემის პირველმა ვარიანტმა მომხმარებლებს არასწორი გამოსახულებები აჩვენა. ამან მაშინ ფართო კრიტიკა გამოიწვია. მოგვიანებით ერთ-ერთმა დამფუძნებელმა, სერგეი ბრინმა, განაცხადა, რომ პრობლემა არასაკმარისი ტესტირების შედეგი იყო.

კომპანიამ ასევე Veo 2 განაახლა. მას აქვს შესაძლებლობა, ტექსტური აღწერებით ვიდეოებიდან ობიექტები დაამატოს ან წაშალოს. გარდა ამისა, Google-მა მუსიკის გენერაციის მოდელი Lyria 2 გამოუშვა, რომელიც YouTube Shorts-ის შემქმნელებისა და Vertex AI-ის პლატფორმაზე არსებული ბიზნესებისთვისაა განკუთვნილი.

Veo 3-ის მიერ შექმნილი ვიდეო: 1970-იანი წლების ტაქსის უკანა სავარძელი, ზებრის პრინტით, მედუზებით წყალში.

ფოტო: Medium

Veo 3, დიდი ალბათობით, DeepMind-ის ხელოვნური ინტელექტის "ვიდეოდან აუდიოზე" მიმართულებით განხორციელებული ადრინდელი კვლევების შედეგია. გასული წლის ივნისში DeepMind-მა გაამხილა, რომ AI ტექნოლოგიას ავითარებდა, რომელიც ვიდეოსთვის ფონოგრამას შექმნიდა.

უსაფრთხოების მიზნით კომპანია ახალ ტექნოლოგიას იყენებს. ესაა SynthID, რომელიც ვიდეოს თითოეულ კადრში უხილავ ნიშნებს ამატებს.

მიუხედავად იმისა, რომ Google და სხვა კომპანიები Veo 3-ს მძლავრ ხელსაწყოდ გვიხასიათებს, ბევრი ადამიანისთვის ის საფრთხესთან ასოცირდება. 2024 წელს ჩაატარეს კვლევა, რომლის მიხედვითაც, 2026 წლისთვის აშშ-ში კინოს, ტელევიზიისა და ანიმაციის სფეროებში 100 000-ზე მეტი სამუშაო ადგილი, შესაძლოა, AI-ით ჩანაცვლდეს.

თუ სტატიაში განხილული თემა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ტექნოლოგიებზე.