OpenAI’nin güçlü yapay zeka lisan modeli GPT-4, Japonya’nın ulusal fizik tedavi uzmanlığı imtihanını rastgele bir ek eğitim yahut özel hazırlık olmadan muvaffakiyetle geçti. Tıp dünyasında ses getiren muvaffakiyet, GPT-4’ün farklı bilgi alanlarındaki yeteneklerini ve potansiyelini bir defa daha gözler önüne serdi. Araştırmanın bulguları, GPT-4’ün metin tabanlı sorularda hayli tesirli olduğunu, lakin teknik ve görsel içerikli sorularda belli sınırlamaları bulunduğunu ortaya koydu. İşte ayrıntılar…
GPT-4, Japonya’nın ulusal fizik tedavi uzmanlığı imtihanına girdi: %73,4 muvaffakiyet oranı elde etti
Japonya’nın ulusal fizik tedavi uzmanlığı sınavı, 160 genel bilgi sorusu ve 40 pratik soru olmak üzere toplam 200 sorudan oluşuyor. Bu imtihan iştirakçilerin hafıza, manaya, uygulama, tahlil ve kıymetlendirme maharetlerini test ediyor. Araştırmacılar, GPT-4’e bu imtihandan 1000 soru yükledi ve modelin cevaplarını resmi yanıtlarla karşılaştırdı. Sonuçlar, GPT-4’ün bu soruların %73,4’ünü hakikat yanıtladığını gösterdi.

Model, metin tabanlı sorularda epeyce güçlü bir performans sergiledi ve %80,1 doğruluk oranına ulaştı. Lakin, teknik ayrıntılar içeren ve görsellerle desteklenen sorularda modelin doğruluk oranı %46,6’ya düştü. Bilhassa tablo ve fotoğraf içeren sorular, modelin en zorlandığı alanlar oldu; bu çeşit sorularda doğruluk oranı %35,4 üzere düşük bir düzeyde kaldı.
Bu sonuçlar, GPT-4’ün lisan sürece konusundaki üstün yeteneklerine karşın, görsel data ile harmanlanmış kompleks meselelerde sınırlamaları olduğunu gösteriyor. Araştırmanın bir öbür enteresan bulgusu ise GPT-4’ün, büyük ölçüde İngilizce bilgi setleri ile eğitilmiş olmasına karşın, Japonca sorularda da epey başarılı sonuçlar elde etmesi.

Bu durum, modelin çok lisanlı yeteneklerini ve farklı lisanlarda tesirli bir formda performans gösterebilme kapasitesini de gözler önüne seriyor. Sonuç olarak, GPT-4’ün bu muvaffakiyet oranı, yapay zekanın karmaşık bilgi alanlarındaki potansiyelini ve hudutlarını keşfetmek için mutlaka değerli bir adım.

Metin tabanlı sıkıntılarda güçlü olsa da, görsel ve teknik bahislerde daha fazla geliştirilmesi gerektiği açıkça görülüyor. Tekrar de bu muvaffakiyet, yapay zeka teknolojilerinin eğitim ve profesyonel imtihanlar üzere alanlarda nasıl bir rol oynayabileceğini dünyaya bir sefer daha gösterdi.
Peki, siz ne düşünüyorsunuz? Görüşlerinizi aşağıdaki yorumlar kısmına yazabilirsiniz.

Brezilya’da X platformu yasaklandı! İşte nedeni?
2
Youtube İzlenme Satın Al Ucuz
21815 kez okundu
3
TÜP BEBEK TEDAVİSİNDE YAŞANAN SON GELİŞMELER
16462 kez okundu
4
Fujifilm X-M5 Vlogger kit kutu açılımı!
13753 kez okundu
5
NVIDIA Studio’da yaratıcılığı destekleyen yeni uygulamalar çıkış yaptı!
11888 kez okundu