Google-მა შექმნა AI, რომელიც ტექსტს 3D ობიექტებად აქცევს

DreamFusion, Google-ის შემდეგი თაობის, ხელოვნური ინტელექტის მქონე ტექსტის 3D გამოსახულების გენერატორი, უკვე აქ არის.

DreamFusion არის Dream Fields-ის — ტექსტის 3D გამოსახულების გენერატორის განვითარების შემდეგი ეტაპი. Dream Fields Google-მა გამოუშვა ჯერ კიდევ 2021 წელს. Dream Fields-ის მსგავსად, DreamFusion ქმნის თავის 3D სურათებს ნეირონული გამოსხივების ველის (NeRF) — ან ნეირონული ქსელის კომბინაციით, რომელსაც შეუძლია შექმნას სინთეზური 3D სცენები ნაწილობრივი 2D მონაცემთა ნაკრების გამოყენებით — ტექსტით გამოსახულების მოთხოვნის წინასწარ შემუშავებული მოდელით.

ირონიულია, რომ Dream Fields-ისგან განსხვავებით, რომელიც იყენებდა OpenAI-ის CLIP ტექნოლოგიას, DreamFusion ახლა იყენებს საკუთარს: Imagen-ს, DALL-E 2-ის კონკურენტს. ანუ Google-მა შეისწავლა ილონ მასკის OpenAI ტექნოლოგია და გაარკვია, თუ როგორ გამოეყენებინა საკუთარი.

"მოხარული ვარ, წარვადგინო DreamFusion, ჩვენი Text-to-3D-ის ახალი მეთოდი!", — წერს Twitter-ზე ბენ პული, Google Brain-ის მკვლევარი. "ჩვენ NeRF-ს ვაოპტიმიზებთ ნულიდან ტექსტიდან გამოსახულების მიღების დიფუზიური მოდელის გამოყენებით. 3D მონაცემები საჭირო არ არის!"

Happy to announce DreamFusion, our new method for Text-to-3D!https://t.co/4xI2VHcoQW

We optimize a NeRF from scratch using a pretrained text-to-image diffusion model. No 3D data needed!

Joint work w/ the incredible team of @BenMildenhall @ajayj_ @jon_barron #dreamfusion pic.twitter.com/YeG0zaFxuu
— Ben Poole (@poolio) September 29, 2022

მიუხედავად იმისა, რომ DreamFusion მოდელები არ არის რეალისტური, ისინი, რა თქმა უნდა, საკმაოდ შთამბეჭდავია. როგორც მისი შემქმნელები განმარტავენ, ხელოვნური ინტელექტის გენერირებული ფორმები, რომლებიც ნაჩვენებია მათ ვებსაიტზე, არის "თანმიმდევრული, მაღალი ხარისხის, ზედაპირის გეომეტრიითა და სიღრმით და შუქდება ლამბერტის დაჩრდილვის მოდელით."

სხვა სიტყვებით რომ ვთქვათ, შეიძლება ისინი DALL-E 2-ს სურათებივით დამაჯერებლად რეალისტურები არ არიან, მაგრამ ყველა საჭირო ელემენტი აქვთ — პროპორციები სწორია, სიღრმეც მისაღებია და ა.შ. ეს ვერსია, OpenAI-ისთან შედარებით, ვიზუალურად გაუმჯობესებულია.

უცნობია, როდის იქნება DreamFusion საზოგადოებისთვის ხელმისაწვდომი, თუმცა ჩვენ უკვე ნამდვილად შეგვიძლია ვიხილოთ რამდენიმე აპლიკაცია. ამგვარი ტექნოლოგიის განვითარება თამაშების დეველოპერებისთვის განსაკუთრებით სასიხარულო იქნება! ხოლო ტვითერის თანახმად, ის უკვე გამოიყენეს, რომ დაებეჭდათ 3D მოჩვენება, რომელიც ჰამბურგერს ჭამს.

ბოლო ამბები:

გირჩევთ

Google-მა შექმნა AI, რომელიც ტექსტს 3D ობიექტებად აქცევს — როგორ

კომენტარები

კვირის ტოპ-5

გირჩევთ