ერთ-ერთი ბოლო კვლევის თანახმად, ChatGPT-მ კლინიკური გადაწყვეტილების მიღებისას 72%-იანი სიზუსტე აჩვენა ყველა სამედიცინო სპეციალობაში, რაც სამედიცინო სკოლის კურსდამთავრებულის მსგავსი შედეგია. საბოლოო დიაგნოზის დასმისას სიზუსტე 77% იყო. კვლევა დიდი ენობრივი მოდელების (LLM) პოტენციალზე უთითებს.

კვლევა მასაჩუსეტსის ბრიგემის უნივერსიტეტის მკვლევრებმა ჩაატარეს. ამ ფართომასშტაბიან ენობრივ მოდელზე (LLM) დაფუძნებულმა ხელოვნურმა ინტელექტმა თანმიმდევრული შედეგები აჩვენა, როგორც პირველადი ჯანდაცვის, ასევე გადაუდებელი ჯანდაცვის სფეროში.

"ჩვენი ნაშრომი აჩვენებს, რომ ChatGPT-ის სამედიცინოს დიაგნოზის დასმა საკმაოდ ზუსტად შეუძლია. ამ მხრივ ხელოვნურ ინტელექტს ძალიან დიდი პოტენციალი აქვს", —თქვა კვლევის ავტორმა მარკ სუჩიმ.

ChatGPT-ის შედარება სამედიცინო პროფესიონალებთან

"ჩვენ ვვარაუდობთ, რომ ეს მაჩვენებელი სამედიცინო სკოლის ახალი კურსდამთავრებულის დონეზეა, მაგალითად, სტაჟიორის ან რეზიდენტის. ეს გვეუბნება, რომ LLM-ს, ზოგადად, აქვს პოტენციალი, იყოს სამედიცინო პრაქტიკის გამაძლიერებელი ინსტრუმენტი და შთამბეჭდავი სიზუსტით დაეხმაროს კლინიკური გადაწყვეტილების მიღებას", — აღნიშნულია კვლევაში.

ხელოვნური ინტელექტის მიმართულებით ცვლილებები სწრაფი ტემპით მიმდინარეობს და მრავალ სფეროს, მათ შორის ჯანდაცვას, ცვლის. მეორე მხრივ, LLM-ების შესაძლებლობები, ბოლომდე შესწავლილი ჯერ არ არის.

კვლევა ჩატარდა 36 სტანდარტიზებული, გამოქვეყნებული კლინიკური აღწერილობების თანმიმდევრული ნაწილების ChatGPT-ისთან ინტეგრირებით. AI-ს თავდაპირველად პაციენტის საწყისი ინფორმაციის საფუძველზე შესაძლო ან დიფერენციალური დიაგნოზების ნაკრების შედგენა სთხოვეს, რომელიც მოიცავდა ასაკს, სქესსა და სიმპტომებს.

შემდეგ ChatGPT-ს მიეცა დამატებითი ინფორმაცია და სთხოვეს მართვის შესახებ გადაწყვეტილებების მიღება, ასევე საბოლოო დიაგნოზის დასმა — რეალური პაციენტის გასინჯვის მთელი პროცესის სიმულირება.

მკვლევრებმა აღმოაჩინეს, რომ საერთო ჯამში, ChatGPT დაახლოებით 72%-ით ზუსტი იყო და საუკეთესო შედეგი საბოლოო დიაგნოზის დასმისას ჰქონდა, სადაც მისი სიზუსტე 77% იყო. ხელოვნურ ინტელექტს ყველაზე დაბალი შედეგი დიფერენციალური დიაგნოზის დასმისას ჰქონდა, სადაც მისი სიზუსტე მხოლოდ 60% იყო. კლინიკური მართვის გადაწყვეტილებების მიღებისას კი, მაგალითად, სწორი დიაგნოზის დასმის შემდეგ პაციენტის სამკურნალო მედიკამენტების განსაზღვრისას, მისი სიზუსტე მხოლოდ 68% აღმოჩნდა.

კვლევის სხვა აღსანიშნავ დასკვნებს შორის იყო ის, რომ ChatGPT-ის პასუხებში გენდერული დისკრიმინაცია არ ჩანდა და მისი საერთო ეფექტიანობა სტაბილური იყო როგორც პირველად, ასევე გადაუდებელ სამედიცინო დახმარებაში.

"ChatGPT-ს დიფერენციალური დიაგნოზის დასამის პრობლემა ჰქონდა, რაც მედიცინის არსია, როდესაც ექიმს უწევს გადაწყვიტოს, რა უნდა გააკეთოს. ეს მნიშვნელოვანია, რადგან ის გვეუბნება, სად არიან ექიმები ნამდვილად ექსპერტები და რას ანიჭებენ ყველაზე მეტ ღირებულებას — პაციენტის მოვლის ადრეულ ეტაპებზე, როდესაც მცირე ინფორმაციაა წარმოდგენილი", — აღნიშნეს მკვლევრებმა.

ხელოვნური ინტელექტის ინსტრუმენტების გაჩენა ჯანდაცვაში რევოლუციური იყო და მას აქვს პოტენციალი, დადებითად შეცვალოს მედიცინა. ავტორების თქმით, საჭიროა მეტი საორიენტაციო კვლევა და მარეგულირებელი სახელმძღვანელოები.

კვლევა დაფინანსდა ზოგადი სამედიცინო მეცნიერებათა ეროვნული ინსტიტუტის მიერ.

თუ სტატიაში განხილული თემა და ზოგადად: მეცნიერებისა და ტექნოლოგიების სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში – შემდეგი ჯგუფი.