ChatGPT'nin öncülük ettiği ve ardından Gemini, DeepSeek, Llama ve Grok gibi modellerle çeşitlenen büyük dil modelleri (LLM), günlük hayatın önemli bir parçası haline gelirken, bu modellerin bilgi kaynakları da tartışmaların odağında yer alıyor. Derlenen verilere göre, aralarında ChatGPT'nin de bulunduğu bu yapay zeka modelleri, sorgulamalara cevap verirken en yüksek oranda alıntıyı Reddit sosyal medya platformundan yapıyor.
Online istatistik portalı Statista, yapay zeka dil modellerinin hangi kaynakları ne sıklıkta kullandığını araştırdı. Statista'nın Haziran ayında gerçekleştirdiği araştırmanın sonuçlarına göre, yılın ilk çeyreğinde büyük dil modelleri tarafından en çok alıntılanan web sitesi açık ara farkla reddit.com oldu.
REDDİT YÜZDE 40 İLE İLK SIRADA, WİKİPEDİA İKİNCİ
Araştırma verilerine göre, büyük dil modellerinin sorgulama cevaplarında kullandığı kaynaklar arasında Reddit, yüzde 40,11 gibi yüksek bir oranla ilk sırada yer aldı.
Uzmanlar, yapay zekanın gerçek kişilerin belli konular üzerine yaptığı tartışmaların yer aldığı Reddit'ten alıntı yapmasını, dil modellerini geliştirenlerin resmî ve düzenlenmiş bilgilerden ziyade, gerçek kişilerin doğal konuşmalarını daha çok önceliklendirdiğini gösterdiğini belirtiyor.
Büyük dil modelleri, Reddit'ten sonra en çok alıntıyı ise yüzde 26,3 oranıyla "internet ansiklopedisi" olarak tanımlanan Wikipedia'dan alıyor. Araştırma, düzenlenmiş makaleleri kullanan Wikipedia'nın, herhangi bir düzenleme süzgecinden geçmeyen Reddit verilerinin bir hayli gerisinde kaldığını ortaya koyuyor.
EN ÇOK ALINTI YAPILAN DİĞER KAYNAKLAR
Hangi büyük dil modelinin hangi kaynağı ne kadar sıklıkla gösterdiğini belirten listeye göre, ilk sıralarda yer alan diğer kaynaklar ve alıntı oranları şu şekilde sıralanıyor:
Youtube: %23,5
Google: %23,2
Yelp.com: %21
Facebook: %19,9
Amazon: %18,7
Tripadvisor: %12,4
Mapbox.com: %11,2
Openstreetmap.com: %11,2
YAPAY ZEKA DEVLERİ İLE REDDİT ARASINDAKİ ANLAŞMALAR
Yapay zeka modellerinin eğitilmesi konusunda sosyal medya devleri ile yapay zeka üreticileri arasında yapılan anlaşmalar da bu durumu pekiştiriyor.
Reuters'ta yer alan bilgilere göre, 2024 yılında Google ile Reddit arasında bir anlaşma yapıldı. Bu anlaşma kapsamında Google'ın yapay zekaları, Reddit verileriyle de besleniyor ve Google, Reddit'e yıllık 60 milyon dolar ödeme yapmayı taahhüt ediyor.
Ayrıca, yine Reuters imzalı bir diğer habere göre Reddit, OpenAI şirketi ile ChatGPT'de kullanılmak üzere bir veri paylaşımı anlaşması daha imzaladı. Böylece, bugün yapay zekanın verdiği cevaplardaki Reddit etkisi, yapılan bu önemli anlaşmalarla da resmî olarak perçinlenmiş oldu.
