ამერიკა და ჩინეთი მუდმივ ჭიდილში არიან, რომ ხელოვნური ინტელექტის (AI) ერთმანეთისაზე დახვეწილი მოდელები შექმნან. მნიშვნელოვანია არამხოლოდ ხარისხი და სიმძლავრე, არამედ მათ შესაქმნელად გაღებული დროისა და რესურსის მოცულობაც. როგორც ჩანს, ამ უკანასკნელი მაჩვენებლებით ახალმა ჩატბოტმა, DeepSeek-ის R1-მა მოდელმა, ChatGPT-ს გადაასწრო. R1 სულ რაღაც 2 თვეში შექმნეს სულ რაღაც $6 მილიონით.

მოდით, გავიგოთ: როგორ აღზევდა ლურჯი ვეშაპის ლოგოს მქონე DeepSeek, როგორია მისი მოდელი და რამდენად საფუძვლიანია ვიფიქროთ, რომ იგი ამერიკულ ChatGPT-ს სჯობს.

DeepSeek-ის R1-მა მოდელმა "რა ჰქმნა"

AI ინდუსტრიაზე DeepSeek-ის ახალი მოდელის ჩაშვებამ დიდი გავლენა იქონია, მათ შორის საფონდო ბირჟაზე. ჩინური სტარტაპის გააქტიურების შედეგად არაერთი კომპანიის აქციების ფასი შემცირდა; მათ შორის, მაგალითად, Nvidia-მ დაახლოებით $600 მილიარდით იზარალა.

DeepSeek-ის სისტემის გამოშვებამ შიში გააჩინა იმისა, რომ Nvidia-ს მაღალი ხარისხის გრაფიკული პროცესორების მოთხოვნა შემცირდებოდა; შედეგად 27 იანვარს Nvidia-ს აქციების გაყიდვა მასობრივად დაიწყეს. ერთი დღის მასშტაბით ეს აშშ-ის ისტორიაში ყველაზე დიდი ზარალი იყო. შეშფოთება სხვა ტექნოლოგიურ გიგანტებსაც შეეხო, მათ შორის Broadcom-სა და Microsoft-ს.

საფონდო "დაცემა" ხანმოკლე აღმოჩნდა. 28 იანვრისთვის Nvidia-ს აქციების ფასმა 9%-ით აიწია, რაც ინვესტორების მხრიდან ნდობის დაბრუნებაზე მიუთითებს. ექსპერტების აზრით, DeepSeek-ის ეკონომიური მოდელი შთამბეჭდავია, თუმცა ხელოვნური ინტელექტის განვითარებაში Nvidia-ს როლს იგი სრულებითაც არ აკნინებს. მეტიც მსგავსმა ინოვაციებმა, შესაძლოა, გააფართოოს კიდეც ბაზარი და Nvidia-ს დახვეწილ პროცესორებზე დამატებითი მოთხოვნა წარმოშვას.

DeepSeek-ის წარმატებამ არაერთგვაროვანი რეაქცია გამოიწვია. Microsoft-ისა და OpenAI-ს დირექტორებმა სტარტაპი შეაქეს, თუმცა ილონ მასკმა მის სიცოცხლისუნარიანობასთან დაკავშირებით სკეპტიკური განწყობა გამოხატა. თავად Nvidia-მ DeepSeek-ის წარმატება აღიარა; კომპანიიდან აღნიშნეს, რომ სტარტაპი აშშ-ის საექსპორტო რეგულაციებს ემორჩილება და პარალელურად ახალ მიდგომასაც გვთავაზობს AI მოდელების შესაქმნელად.

ასევე იხილეთ: "კონკურენციაში გამარჯვებაზე უნდა ვფოკუსირდეთ" — ტრამპი DeepSeek-ის ჩაშვებას გამოეხმაურა

მიუხედავად აჟიოტაჟისა, საგულისხმოა, რომ Nvidia-ს ჩიპებს AI-ს "ლოგიკური დამუშავების" ეტაპისთვის მაინც გადამწყვეტი მნიშვნელობა აქვს (არ უნდა დაგვავიწყდეს ისიც, რომ DeepSeek-მა თავისი მოდელი Nvidia-ს ძველი ჩიპებით გაწვრთნა), ანუ ეს კომპანია ინდუსტრიაში კვლავაც მნიშვნელოვანი რჩება.

რა ვიცით DeepSeek-ის შესახებ

DeepSeek ჩინური AI სტარტაპია, რომელიც 2023 წელს ლიანგ ვენფენგმა დააფუძნა. კომპანიის მთავარი მიზანია, ღია კოდის კვლევითა და მიღწევებით ხელოვნური ზოგადი ინტელექტი (AGI) დახვეწოს და AI ყველასათვის ხელმისაწვდომი გახადოს — როგორც კომერციული, ასევე აკადემიური მიზნებისთვის. კომპანია ნაკლები დანახარჯით ცდილობს შექმნას ღია კოდის დიდი ენობრივი მოდელები (LLM-ები), რომლებიც კონკურენტ პროდუქტებზე არანაკლებ ხარისხიანი იქნება.

ცნობისთვის: ღია კოდის მქონე სისტემა არის სისტემაა, რომლის საწყისი კოდიც საჯაროდაა ხელმისაწვდომი. მისი გადახედვა, გამოყენება და შეცვლა ყველას შეუძლია.

ლიანგ ვენფენგი, DeepSeek AI-ს აღმასრულებელი დირექტორი

ფოტო: Chinatalk Media | Sohu

DeepSeek-ს ამჟამად ორი მოდელი აქვს:

DeepSeek-V3

ეს მოდელი 2024 წლის ბოლოს ჩაეშვა. მას დაახლოებით 671 პარამეტრი აქვს. V3 მოდელს 14.8 ტრილიონი ტოკენის მქონე მონაცემთა ბაზაზე წვრთნიდნენ 55 დღის განმავლობაში, რაც დაახლოებით $5.58 მილიონი დაჯდა.

ტესტირების მიხედვით, DeepSeek-V3 იმაზე უკეთ მუშაობს, ვიდრე Llama 3.1 და Qwen 2.5; პერფორმანსით იგი უტოლდება GPT-4o-სა და Claude 3.5 Sonnet მოდელებს.

DeepSeek-R1

სწორედ ესაა მოდელი, რომელიც 2025 წლის იანვარში გამოუშვეს. იგი ლოგიკური ვარაუდების გამოთქმაზე, მათემატიკურ აზროვნებასა და პრობლემების რეალურ დროში გადაჭრაზეა ორიენტირებული. იგი განმტკიცებით სწავლის მეთოდით გაწვრთნეს, აზროვნების უნარების გასაუმჯობესებლად კი GRPO მიდგომას მიმართეს. სხვადასხვა საქმეში, მათ შორის მათემატიკური ოპერაციების შესრულებასა და კოდირებაში, ეს მოდელი ხარისხით OpenAI-ს o1 მოდელს (ChatGPT-ს ფასიანი ვერსია) უტოლდება.

ChatGPT სჯობს თუ DeepSeek?

DeepSeek-ის AI მოდელები ეფექტიანობითა და ეკონომიურობით გამოირჩევა. მაგალითისთვის, DeepSeek-V3 მოდელი Nvidia-ს დაახლოებით ორიათასი H800 ჩიპის გამოყენებით გაწვრთნეს; ამან 55 დღე და დაახლოებით $5.58 მილიონი წაიღო — იმაზე ბევრად ნაკლები დრო და რესურსი, ვიდრე სხვა კომპანიებმა დახარჯეს თავიანთ მოდელებზე. ამ ეკონომიურობამ მოწინავე ტექნოლოგიური კომპანიები საკუთარ მასშტაბურ ინვესტიციებზე დააფიქრა, რომლებიც მათ ხელოვნური ინტელექტის განვითარებაში ჩადეს.

DeepSeek-სა და OpenAI-ს ChatGPT-ს შორის მთავარი განსხვავება ისაა, რომ ჩინური ჩატბოტი ღია კოდს ეფუძნება. OpenAI თავისი სერვისის მუშაობასთან დაკავშირებულ დეტალებს არ გვიზიარებს, DeepSeek-ს კი ღია კოდი აქვს, ანუ მისი შესწავლა და ტექნოლოგიის განვითარება ყველას შეუძლია. მსგავსი მიდგომა, თავისთავად, თანამშრომლობაზე დამყარებულ საზოგადოებას ახალისებს, თუმცა იმის რისკებსაც აჩენს, რომ ამით ვინმე ბოროტად ისარგებლებს.

DeepSeek-ის R1 მოდელი ChatGPT-ს უახლეს ვერსიებს უწევს კონკურენციას. კოდირებასა და წერას ორივე მოდელი შესანიშნავად ართმევს თავს, DeepSeek-ის უპირატესობა კი იმაში მდგომარეობს, რომ ამ ეტაპზე იგი სრულიად უფასოა. ChatGPT სერვისს უფასოდაც გვთავაზობს, თუმცა პრემიუმ ფუნქციების მისაღებად თანხის გადახდაა საჭირო. DeepSeek, მეორე მხრივ, AI-ზე წვდომას ყველას აძლევს.

ამან ახალი ჩატბოტის პოპულარობაც განაპირობა და მან გადმოწერების მაჩვენებლით ChatGPT-ს აპლიკაციას გადაუსწრო. თავისთავად AI-ზე შეუზღუდავი წვდომა მომხმარებელთა უსაფრთხოებას კითხვისნიშანის ქვეშ აყენებს.

DeepSeek-ის აპლიკაციამ დიდი პოპულარობა მოიპოვა და გადმოწერების მაჩვენებლით ChatGPT-საც გადაასწრო.

ფოტო: Getty Images

DeepSeek-ის ეფექტიანობას დიდწილად ის განსაზღვრავს, რომ მას "შერეული ექსპერტების" არქიტექტურა აქვს; ეს ხარისხიანი პერფორმანსს უზრუნველყოფს, თანაც ნაკლებ გამოთვლით ძალას მოითხოვს. ChatGPT, მეორე მხრივ, მეტად კომპლექსური მოდელია. ეს იმის მიუხედავად, რომ DeepSeek-ის ჩატბოტი ChatGPT-ს თითქმის ზუსტი ანალოგია (რაც აჩენს მოსაზრებას, რომ სწორედ ChatGPT-ს არსებობამ შექმნა წინაპირობა, რომ ახალი მოდელი ბევრად მარტივად შექმნილიყო).

მიუხედავად ამ მოდელის ძლიერი მხარეებისა, DeepSeek ჩინეთის მთავრობის ქვეშ ფუნქციონირებს, რის გამოც ზოგიერთ საკითხს ცენზურა ადევს, რაც ინფორმაციის თავისუფლებას ეჭვქვეშ აყენებს. მეორე მხრივ, ChatGPT-სთან შეზღუდულად, თუმცა მაინც მეტი საკითხის განხილვაა შესაძლებელი.

თავისთავად, DeepSeek-ის გამოჩენამ AI გიგანტებს თავიანთი ტექნოლოგიური სტრატეგიების გადააზრებისკენ უბიძგა. მეორე მხრივ, რადგან სერვისი ჩინურია, კონფიდენციალურობასა და ეროვნულ უსაფრთხოებასთან დაკავშირებულმა შეკითხვებმა მაინც იჩინა თავი.

ცნობისთვის, DeepSeek-ის ახალო მოდელის ჩაშვებიდან რამდენიმე დღის შემდეგ გაირკვა, რომ მისგან ინფორმაცია ჟონავდა. ახლახან Wiz Research-ის მკვლევრებმა DeepSeek-ის მონაცემთა ბაზები დაათვალიერეს. მათ მალევე აღმოაჩინეს, რომ უამრავ შიდა მონაცემზე ძალიან მარტივად შეეძლოთ წვდომა, რადგან ეს ყველაფერი დაუშიფრავი აღმოჩნდა. წვდომის მოპოვება შეძლეს როგორც მომხმარებლების საუბრებზე, ასევე სხვა ტიპის სენსიტიურ ინფორმაციაზეც. DeepSeek-ის გუნდმა მონაცემთა ბაზებზე წვდომა მალევე დახურა, რაც ეს ამბავი გავრცელდა.

იხილეთ: DeepSeek-მა "საიდუმლოებები გათქვა" — ჩატბოტიდან სენსიტიურმა მონაცემებმა გაჟონა

ამ ყველაფრის ფონზე, შეიძლება ითქვას, ChatGPT და DeepSeek ხელოვნური ინტელექტისადმი ორი განსხვავებული მიდგომაა. პირველის შემთხვევაში პრიორიტეტი უფრო პერფორმანსი და კონტროლია, მეორისაში კი — ღიაობა და ხელმისაწვდომობა.


DeepSeek-ის სწრაფმა აღზევებამ AI შერკინებაში მნიშვნელოვანი ცვლილებები გამოიწვია და მწვავე დისკუსია გააჩაღა. AI ინდუსტრიისათვის მის წარმატებას ზოგი "სპუტნიკის მომენტადაც" მოიხსენიებს — მოვლენად, რომელიც ტექნოლოგიური ლიდერობის კუთხით გარდატეხას ნიშნავს, პარალელურად კი ინოვაციების ბალანსზე გვაფიქრებს ჩინეთსა და დასავლურ სახელმწიფოებს შორის.

ჯერჯერობით რთული სათქმელია, რა გეგმები აქვს DeepSeek-ს. ამ ეტაპზე კომპანია კვლევით მიმართულებაზეა ფოკუსირებული და კომერციალიზაციის რაიმე გეგმა არ გაუზიარებია. განსხვავებით აშშ-ის AI ლაბორატორიებისგან, DeepSeek სერვისებს ამჟამად სრულიად უფასოდ გვთავაზობს.

სტარტაპის წარმატება ხაზს უსვამს იმას, რომ AI-ს შეზღუდვა თანდათან შეუძლებელი ხდება — როგორც Anthropic-ის თანადამფუძნებელმა ჯეკ კლარკმა აღნიშნა, "DeepSeek ნიშნავს, რომ ხელოვნური ინტელექტის სწრაფი ზრდა გარანტირებულია". ვინ იცის, იქნებ იგი ახალი AI მოდელების კასკადსაც მოუძღოდეს წინ.

თუ სტატიაში განხილული თემა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ტექნოლოგიებზე.