Muhakeme gücü iki katına çıktı: Gemini 3.1 Pro şov yapıyor

Muhakeme gücü iki katına çıktı: Gemini 3.1 Pro şov yapıyor

Google, karmaşık problemleri çözmek ve akıl yürütme becerilerini zirveye taşımak amacıyla geliştirdiği yeni yapay zeka modeli Gemini 3.1 Pro versiyonunu tanıttı. Humanity's Last Exam testinde yüzde 44.4 başarı yakalayan model, ARC-AGI-2 puanını yüzde 77.1 seviyesine çıkararak önceki sürümü ikiye katladı. Geliştiriciler için Android Studio ve Google AI Studio üzerinden erişime açıldı.

Google, teknoloji dünyasında ses getiren hamlesini yaparak en yeni dil modeli Gemini 3.1 Pro versiyonunu duyurdu.

Yapay zeka haberleri içinde en çok dikkat çeken gelişme, en yeni teknoloji gelişmeleri arasında zirveye yerleşti.

Google Gemini güncel haberler takibinde olan kullanıcılar için üretken yapay zeka modelleri yetenekleri bir adım ileri taşındı.

En güçlü yapay zeka arayışında olanlar için geliştirilen sistem, temel muhakeme konusunda devrim yarattı.

MUHAKEME PERFORMANSINDA DEV SIÇRAMA

Geçtiğimiz aylarda tanıtılan Gemini 3 Pro ve Gemini 3 Flash modellerinden sonra gelen 3.1 Pro, akademik muhakemede çıtayı yükseltti.

Humanity's Last Exam testinde yüzde 44.4 puan alan model, ChatGPT-5.2 versiyonunun yüzde 34.5 olan skorunu geride bıraktı.

Soyut akıl yürütme bulmacalarını içeren ARC-AGI-2 testinde yüzde 77.1 başarı gösteren yeni sürüm, Gemini 3 Pro modelinin performansını iki katına çıkardı.

KARMAŞIK VERİLERİ SENTEZLEME YETENEĞİ

Kullanıcılar artık karmaşık konuların görsel açıklamalarını ararken veya verileri tek bir ekranda sentezlerken bu gelişmiş yapıdan faydalanıyor.

Basit cevapların yetersiz kaldığı zorlu görevler için tasarlanan model, grafikler ve simülasyonlar üretme konusunda da uzmanlaştı.

Google yetkilileri, modelin özellikle agentic iş akışlarına odaklanan yeni özelliklerini yakında genel kullanıma sunacaklarını açıkladı.

google-gemini-3-1-pro-ozellikleri-neler.jpg

GENİŞ ERİŞİM VE GELİŞTİRİCİ ARAÇLARI

Önizleme aşamasında olan Gemini 3.1 Pro modeline Gemini uygulaması üzerinden ulaşılabiliyor.

Google AI Pro ve Ultra aboneleri ise NotebookLM üzerinden sistemi kullanabiliyor.

Geliştiriciler için de geniş imkanlar sağlandı; Google AI Studio, Vertex AI, Gemini Enterprise, Gemini CLI ve Android Studio aracılığıyla Gemini API erişimi aktif hale getirildi.

BİLİMSEL VE KODLAMA BAŞARILARI

Bilimsel araştırma kodlamasında SciCode testinden yüzde 59 alan model, GPQA Diamond testinde yüzde 94.3 gibi yüksek bir skora ulaştı.

Kodlama alanında ise SWE-Bench Verified üzerinde yüzde 80.6 başarı yakalarken, LiveCodeBench Pro testinde 2887 Elo puanı alarak rakiplerini zorladı.

Agentic araç kullanımında yüzde 90.8 ile yüzde 99.3 arasında değişen yüksek verimlilik sergiledi.

ÇOK MODLU ANLAMA VE UZUN BAĞLAM DESTEĞİ

Çok modlu anlama yeteneğini ölçen MMMU Pro testinde yüzde 80.5 başarı yakalayan model, MMMLU testinde ise yüzde 92.6 skor elde etti.

Uzun bağlam performansında 128 bin kelime ortalamasında yüzde 84.9 başarı gösterirken, 1 milyon kelimelik verilerde yüzde 26.3 seviyesinde kaldı.

Agentic arama yeteneği olan BrowseComp testinde ise yüzde 85.9 puan alarak bilgiye erişim hızını kanıtladı.

YORUMLAR
YORUM YAZ
İÇERİK VE ONAY KURALLARI: KARAR Gazetesi yorum sütunları ifade hürriyetinin kullanımı için vardır. Sayfalarımız, temel insan haklarına, hukuka, inanca ve farklı fikirlere saygı temelinde ve demokratik değerler çerçevesinde yazılan yorumlara açıktır. Yorumların içerik ve imla kalitesi gazete kadar okurların da sorumluluğundadır. Hakaret, küfür, rencide edici cümleler veya imalar, imla kuralları ile yazılmamış, Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar içeriğine bakılmaksızın onaylanmamaktadır. Özensizce belirlenmiş kullanıcı adlarıyla gönderilen veya haber ve yazının bağlamının dışında yazılan yorumlar da içeriğine bakılmaksızın onaylanmamaktadır.
Diğer Haberler
Son Dakika Haberleri
KARAR.COM’DAN