10500,60%0,49
41,27% 0,06
48,43% -0,27
4837,68% 0,32
7891,27% 1,14
Şirketin yeni yayımladığı araştırma raporuna göre, algoritmalar boş bırakmak yerine yanıt vermeyi ödüllendiren bir sistemle çalışıyor.
Araştırmacılar, bu durumu çoktan seçmeli sınavlarda cevabı bilmeyen öğrencilerin şansına işaretleme yapmasına benzetti. Çünkü yanıt verilmediğinde hiçbir puan alınmazken, tahmin yapıldığında doğru çıkması halinde puan kazanılıyor. Bu nedenle LLM’ler, belirsiz kaldığında dahi cevap üretmeye programlanıyor.
OpenAI’nin raporu, GPT-5’in yayımlanmasından birkaç hafta sonra geldi. Şirket, yeni modelin “halüsinasyonlara karşı dayanıklı” olduğunu ve önceki sürüm GPT-4o’ya kıyasla yüzde 46 daha az yanlış bilgi verdiğini iddia ediyor. Ancak ABD’de yapılan son bir araştırma, ChatGPT modellerinin genel olarak yanıtlarının yüzde 40’ında yanlış bilgi yaydığını ortaya koydu.
Raporda, yazım ve gramer gibi kurallı alanlarda yapay zekâların daha başarılı olduğu, ancak belirsiz veya tanımsız kategorilerde kaçınılmaz olarak hata yaptığı vurgulandı. Örneğin, bir algoritma görselleri “kedi” ya da “köpek” olarak doğru sınıflandırabiliyor, fakat resimler hayvanların doğum gününe göre etiketlendiğinde doğru ayrım yapması imkânsız hale geliyor.
OpenAI araştırmacılarına göre, bazı gerçek dünya soruları doğası gereği yanıtsız olduğundan hiçbir model yüzde 100 doğruluk sağlayamayacak. Şirket, halüsinasyonları azaltmak için yapay zekânın bilmediği durumlarda “Bilmiyorum” yanıtı verecek şekilde yönlendirilebileceğini ve mevcut puanlama sisteminin yeniden tasarlanabileceğini belirtiyor. (İLKHA)