ChatGPT ve yapay zekanın gizli kaynağı: Reddit

ChatGPT ve yapay zekanın gizli kaynağı: Reddit

Aralarında ChatGPT, Gemini ve Llama'nın da bulunduğu büyük dil modellerinin (LLM) bilgi kaynakları mercek altına alındı. Statista'nın araştırmasına göre, yapay zeka modelleri sorgulamalara cevap verirken en yüksek alıntıyı yüzde 40,11 gibi ezici bir oranla sosyal medya platformu Reddit'ten yapıyor.

ChatGPT'nin öncülük ettiği ve ardından Gemini, DeepSeek, Llama ve Grok gibi modellerle çeşitlenen büyük dil modelleri (LLM), günlük hayatın önemli bir parçası haline gelirken, bu modellerin bilgi kaynakları da tartışmaların odağında yer alıyor. Derlenen verilere göre, aralarında ChatGPT'nin de bulunduğu bu yapay zeka modelleri, sorgulamalara cevap verirken en yüksek oranda alıntıyı Reddit sosyal medya platformundan yapıyor.

Online istatistik portalı Statista, yapay zeka dil modellerinin hangi kaynakları ne sıklıkta kullandığını araştırdı. Statista'nın Haziran ayında gerçekleştirdiği araştırmanın sonuçlarına göre, yılın ilk çeyreğinde büyük dil modelleri tarafından en çok alıntılanan web sitesi açık ara farkla reddit.com oldu.

REDDİT YÜZDE 40 İLE İLK SIRADA, WİKİPEDİA İKİNCİ

Araştırma verilerine göre, büyük dil modellerinin sorgulama cevaplarında kullandığı kaynaklar arasında Reddit, yüzde 40,11 gibi yüksek bir oranla ilk sırada yer aldı.

Uzmanlar, yapay zekanın gerçek kişilerin belli konular üzerine yaptığı tartışmaların yer aldığı Reddit'ten alıntı yapmasını, dil modellerini geliştirenlerin resmî ve düzenlenmiş bilgilerden ziyade, gerçek kişilerin doğal konuşmalarını daha çok önceliklendirdiğini gösterdiğini belirtiyor.

Büyük dil modelleri, Reddit'ten sonra en çok alıntıyı ise yüzde 26,3 oranıyla "internet ansiklopedisi" olarak tanımlanan Wikipedia'dan alıyor. Araştırma, düzenlenmiş makaleleri kullanan Wikipedia'nın, herhangi bir düzenleme süzgecinden geçmeyen Reddit verilerinin bir hayli gerisinde kaldığını ortaya koyuyor.

EN ÇOK ALINTI YAPILAN DİĞER KAYNAKLAR

Hangi büyük dil modelinin hangi kaynağı ne kadar sıklıkla gösterdiğini belirten listeye göre, ilk sıralarda yer alan diğer kaynaklar ve alıntı oranları şu şekilde sıralanıyor:

  • Youtube: %23,5

  • Google: %23,2

  • Yelp.com: %21

  • Facebook: %19,9

  • Amazon: %18,7

  • Tripadvisor: %12,4

  • Mapbox.com: %11,2

  • Openstreetmap.com: %11,2

YAPAY ZEKA DEVLERİ İLE REDDİT ARASINDAKİ ANLAŞMALAR

Yapay zeka modellerinin eğitilmesi konusunda sosyal medya devleri ile yapay zeka üreticileri arasında yapılan anlaşmalar da bu durumu pekiştiriyor.

Reuters'ta yer alan bilgilere göre, 2024 yılında Google ile Reddit arasında bir anlaşma yapıldı. Bu anlaşma kapsamında Google'ın yapay zekaları, Reddit verileriyle de besleniyor ve Google, Reddit'e yıllık 60 milyon dolar ödeme yapmayı taahhüt ediyor.

Ayrıca, yine Reuters imzalı bir diğer habere göre Reddit, OpenAI şirketi ile ChatGPT'de kullanılmak üzere bir veri paylaşımı anlaşması daha imzaladı. Böylece, bugün yapay zekanın verdiği cevaplardaki Reddit etkisi, yapılan bu önemli anlaşmalarla da resmî olarak perçinlenmiş oldu.

YORUMLAR
YORUM YAZ
İÇERİK VE ONAY KURALLARI: KARAR Gazetesi yorum sütunları ifade hürriyetinin kullanımı için vardır. Sayfalarımız, temel insan haklarına, hukuka, inanca ve farklı fikirlere saygı temelinde ve demokratik değerler çerçevesinde yazılan yorumlara açıktır. Yorumların içerik ve imla kalitesi gazete kadar okurların da sorumluluğundadır. Hakaret, küfür, rencide edici cümleler veya imalar, imla kuralları ile yazılmamış, Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar içeriğine bakılmaksızın onaylanmamaktadır. Özensizce belirlenmiş kullanıcı adlarıyla gönderilen veya haber ve yazının bağlamının dışında yazılan yorumlar da içeriğine bakılmaksızın onaylanmamaktadır.
Diğer Haberler
Son Dakika Haberleri
KARAR.COM’DAN