ChatGPT:
Google, insanların kullandığı gibi bir web tarayıcısında gezinebilen yeni bir yapay zekâ modeli tanıttı. Gemini 2.5 Computer Use adı verilen bu model, tıpkı bir kullanıcı gibi tarayıcı penceresinde tıklayabiliyor, kaydırma yapabiliyor ve metin yazabiliyor. Böylece yalnızca API üzerinden erişilemeyen bilgilere ulaşabiliyor.
Yeni model, yapay zekânın insan arayüzleriyle doğrudan etkileşime girmesini sağlıyor. Görsel anlama ve mantıksal akıl yürütme yeteneklerini kullanarak bir kullanıcının isteğini analiz ediyor; örneğin bir formu doldurup gönderebiliyor. Bu sayede API’si bulunmayan web sitelerinde test, veri toplama veya işlem gerçekleştirme gibi görevlerde kullanılabiliyor.
Google, bu modelin benzer yaklaşımlarını daha önce AI Mode ve araştırma projesi Project Mariner içinde de denemişti. Bu sistemlerde yapay zekâ, örneğin bir alışveriş sepetine malzeme listesine göre ürün ekleyebilme gibi görevleri tarayıcı üzerinden kendi başına yapabiliyordu.
Duyuru, OpenAI’nin yıllık geliştirici etkinliğinde yeni ChatGPT uygulamalarını tanıtmasından yalnızca bir gün sonra geldi. OpenAI, kullanıcı adına karmaşık görevleri üstlenebilen “ChatGPT Agent” özelliğine odaklanırken, Anthropic de geçen yıl benzer şekilde bilgisayar kullanımı destekli bir Claude sürümünü yayımlamıştı.
Google, yeni modelinin “pek çok web ve mobil testte rakiplerinden daha iyi performans gösterdiğini” söylüyor. Ancak bu sistemin ChatGPT Agent veya Anthropic’in bilgisayar kullanım aracından farkı, yalnızca tarayıcı ortamına erişimi olması. Henüz masaüstü işletim sistemi düzeyinde kontrol sağlayamıyor; şu anda tarayıcı açma, metin yazma, sürükle-bırak işlemleri gibi 13 farklı eylemi destekliyor.
Gemini 2.5 Computer Use, geliştiriciler için Google AI Studio ve Vertex AI üzerinden erişilebilir durumda.
