Bilim dünyasında bir ilk gerçekleşiyor: Agents4Science 2025 adlı konferansta, hem sunulan bildiriler hem de hakem değerlendirmeleri tamamen yapay zekâlar tarafından üretildi. 22 Ekim’de çevrim içi olarak düzenlenecek bu etkinlikte, insan katılımcılar yalnızca izleyici ve tartışmacı rolünde olacak.
Konferans, Stanford Üniversitesi’nden yapay zekâ araştırmacısı James Zou’nun öncülüğünde, bilimin üretim ve değerlendirme süreçlerinde yaşanan köklü dönüşümü gözlemlemek amacıyla “güvenli bir deney alanı” olarak tasarlandı. Zou’ya göre artık araştırmacılar yalnızca tekil dil modelleriyle değil, “araştırmacı gibi davranan” çoklu yapay zekâ ajanlarıyla çalışıyor. Bu ajanlar, hipotez kurmadan sonuç yorumlamaya kadar bilimsel sürecin her aşamasında aktif rol alıyor.
Organizatörler, “yapay zekâ hem yazar hem de hakem olmalı” diyerek mevcut akademik kuralları tersine çevirdi. İnsanlar yalnızca yönlendirme ve geri bildirim verebiliyor; asıl üretici, yani “birinci yazar” konumunda yapay zekâ bulunuyor.
Hugging Face araştırmacılarından Margaret Mitchell, bu tür bir etkinliğin yapay zekâ sistemlerinin güçlü ve zayıf yönlerini anlamak için önemli bir fırsat sunduğunu belirtiyor:
“Yapay zekâ ajanlarını nasıl değerlendireceğimizi henüz tam bilmiyoruz. Bu deneyler, yanlış veya yanıltıcı sonuçların ne kadar sık üretildiğini görmemizi sağlayacak.”
Toplam 300’den fazla yapay zekâ ajanının gönderdiği bildirilerden 48’i kabul edildi. Çalışmalar arasında psikanalizden matematiğe uzanan çok çeşitli alanlar yer alıyor. Her bir başvuru, insan araştırmacı ile yapay zekâ arasındaki etkileşimi adım adım belgelemek zorunda kaldı. Böylece insan müdahalesinin kalite üzerindeki etkisi de analiz edilebilecek.
Hakemlik sürecinde de benzer bir deney yürütüldü. İlk değerlendirmeler, NeurIPS konferansının puanlama sistemi temel alınarak yapay zekâlar tarafından yapıldı; daha sonra seçilen makaleler bir insan danışma kurulu tarafından incelendi. Tüm hakem raporları kamuya açık olacak ve insan yazımı değerlendirmelerle karşılaştırılacak.
Yapay zekâ destekli hakemliğin etik boyutu hâlâ tartışmalı. İngiltere Fizik Enstitüsü’nün yaptığı bir ankete göre, araştırmacıların yüzde 57’si, makalelerinin değerlendirilmesinde üretken yapay zekâ kullanılmasına sıcak bakmıyor. Ancak James Zou, başta bilgisayar bilimi olmak üzere birçok alanda artan makale sayısı nedeniyle bu tür desteklerin kaçınılmaz hale geldiğini savunuyor:
“Yayın sayısı patladı. Artık bu yükü paylaşmak için yapay zekâdan yardım almak zorundayız.”
Georgia Teknoloji Enstitüsü’nden Matthew Gombolay ise, mevcut büyük dil modellerinin yenilik ve özgünlük değerlendirmelerinde insanlardan hâlâ geride olduğunu vurguluyor. Ona göre bir sonraki adım, insan ve yapay zekâ hakemlerinin sonuçlarını doğrudan karşılaştıracak geniş ölçekli bir deney yürütmek olmalı.
Kaynak: Elizabeth Gibney, “AI bots wrote and reviewed all papers at this conference”, Nature, 15 Ekim 2025, doi:10.1038/d41586-025-03363-3








