Hafta sonu sosyal medya platformlarında, özellikle X (eski adıyla Twitter) üzerinde pek çok kullanıcı, GPT-4o güncellemesinden sonra ChatGPT’nin her türlü kararı sorgulamadan desteklediğini, aşırı onaylayıcı ve yapay derecede olumlu yanıtlar verdiğini dile getirdi. Kullanıcılar, modelin riskli, uygunsuz ya da etik dışı fikirleri bile destekleyen ifadeler kullandığı ekran görüntülerini paylaşarak duruma dikkat çekti. Bu durum kısa sürede bir internet memesine dönüştü.
Altman: Farkındayız, Çalışıyoruz
OpenAI CEO’su Sam Altman, Pazar günü yaptığı açıklamada sorunu kabul etti ve OpenAI'nin "en kısa sürede düzeltmeler" üzerinde çalıştığını söyledi. İki gün sonra gelen yeni açıklamada Altman, GPT-4o’nun tartışmalı güncellemesinin geri çekildiğini ve modelin kişiliği üzerinde yeni düzenlemelere gidileceğini duyurdu.
'Aşırı Geri Bildirim' Etkisiyle Yapay Samimiyet
OpenAI tarafından yayımlanan blog yazısında, yapılan güncellemenin amacı modelin varsayılan kişiliğini "daha sezgisel ve etkili" kılmak olsa da, bu sürecin kısa vadeli geri bildirimlere fazlasıyla dayanarak geliştirildiği, bu yüzden de kullanıcıların ChatGPT ile olan uzun vadeli etkileşimlerinin yeterince dikkate alınmadığı belirtildi.
“Sonuç olarak, GPT-4o modeli aşırı destekleyici ama samimiyetsiz yanıtlar üretmeye başladı.”
Şirket, bu tür yalakalık içeren etkileşimlerin kullanıcılar üzerinde rahatsızlık, huzursuzluk ve kafa karışıklığı yaratabileceğini vurguladı ve “Bu konuda yetersiz kaldık ve durumu düzeltmek için çalışıyoruz” açıklamasını yaptı.
Model Eğitimi ve Sistem İstemleri Yeniden Şekillendiriliyor
OpenAI, GPT-4o’nun bu tarz sorunlu davranışlarını azaltmak için bazı temel model eğitim tekniklerinde ve sistem istemlerinde değişikliklere gittiklerini belirtti. Sistem istemleri, modelin genel davranışını ve yanıtlarındaki tonu şekillendiren arka plan talimatlardır. Şirket, ayrıca modelin dürüstlüğünü ve şeffaflığını artırmak amacıyla yeni güvenlik bariyerleri eklediklerini de duyurdu.
Kullanıcılara Daha Fazla Kontrol Geliyor
OpenAI, gelecekte benzer durumların önüne geçmek adına kullanıcıların ChatGPT deneyimini daha doğrudan etkilemesine olanak tanıyacak sistemler üzerinde çalıştıklarını açıkladı. Şirket, kullanıcıların birden fazla kişilik seçeneği arasında geçiş yapabileceği ve gerçek zamanlı geri bildirim vererek ChatGPT’nin davranış biçimini özelleştirebileceği yeni yöntemler geliştiriyor.
"Kullanıcıların ChatGPT'nin nasıl davranmasını istediklerine dair daha fazla kontrol sahibi olması gerektiğine inanıyoruz."
Ayrıca OpenAI, ChatGPT'nin varsayılan davranışlarını daha demokratik hale getirmek için küresel ölçekte daha geniş ve çeşitli geri bildirim yöntemleri üzerinde de çalıştığını belirtiyor.