Osmanlı arşivi yapay zeka ile günümüze aktarılıyor

Bilişim çağında gelişen teknolojiler paha biçilemez bir birikim barındıran Osmanlı arşivlerinin gönümüze dönüştürülmesinde kullanılmaya başlandı. Bir doktora tezi olarak başlayan Osmanlica.com projesiyle milyonlarca belge ve dokümandan oluşan Osmanlı arşivleri yapay zeka ile günümüz Türkçesine çevriliyor.

Sosyal bilimlerde en büyük problemlerden biri olan Osmanlı arşiv ve kaynaklarının günümüz Türkçesine aktarılmasına ülkemiz akademisyenlerinden yapay zeka destekli çözüm geliyor. İstanbul Üniversitesi-Cerrahpaşa doktora öğrencisi İshak Dölek’in danışmanıyla birlikte geliştirdiği proje, TÜBİTAK programına kabul edildi. Proje, tamamlanan OCR uygulamasıyla birlikte girişime dönüştürüldü. Cerrahpaşa Bilgisayar Mühendisliği Bölümü’nden Doç. Dr. Atakan Kurt’un danışmanlığında başlayan yerli girişim Osmanlica.com Osmanlıca kaynakların günümüz Türkçesine aktarımının ilk adımı olan Osmanlıca OCR işleminde yüzde 96’lık bir başarı elde etti.

'ÜÇ ADIMDA OSMANLICA-TÜRKÇE AKTARIMI'

Osmanlı arşiv ve kütüphanelerindeki her türlü kaynağı Osmanlıca OCR, Osmanlıca-Türkçe Alfabe Çevirisi ve Osmanlıca-Türkçe Dil Çevirisi olmak üzere üç adımda günümüz Türkçesine aktarmak amacıyla başlayan 'Osmanlica.com: Yapay Zeka Destekli Osmanlıca-Türkçe Uçtan-Uca Aktarım' projesi, alfabe çevirisi projesinde halihazırda yüzde 75 doğruluk oranına erişti. Bu uygulamada yüzde 95’lik bir doğruluk oranı elde etmek için ARGE faaliyetlerine bilgisayar, dil, edebiyat ve tarihçilerden oluşan bir grup ile devam ediyor.

'YÜZDE 96 ORANINDA BAŞARI ELDE EDİLDİ'

Osmanlıca dokümanların günümüz Türkçesine aktarımının ilk adımı olan Osmanlıca OCR işleminde ise yüzde 96 doğruluk oranına ulaştıklarını belirten Doç. Dr. Atakan Kurt “Yurt içi ve dışındaki devlet arşivleri, kütüphane ve özel koleksiyonlarda yüzbinlerce Osmanlıca kitap, gazete, dergi ve belge bulunuyor. Bu kadar belgenin insan eliyle manuel olarak Türkçeye çevrilmesi pratik olarak mümkün değil. Bilgi teknolojilerinde ve yapay zekada son zamanlarda büyük ilerlemeler oldu. Bu sayede daha önce çözülmesi mümkün olmayan problemler yeni gelişmeler ışığında çözülebiliyor. Biz bu yeni teknolojileri Osmanlı arşiv ve kütüphanelerindeki belgelerin günümüz Türkçesine aktarılması için adapte ediyoruz.

'MİLYONLARCA BELGE HIZLICA AKTARILACAK'

OCR ve alfabe çevirisi aşamalarında gözle görülür önemli başarılar elde ettik. Amacımız Osmanlıca kitap, dergi, gazete ve arşiv belgelerinin günümüz Türkçesine çevrilerek sıradan insanlar ve özellikle yeni nesil tarafından okunabilmesi ve anlaşılabilmesini sağlamak ve şimdiye kadar belki de hiç incelenmemiş veya okunmamış belgeleri gün yüzüne çıkararak tarihe ışık tutulması için gerekli yazılımları geliştirmek. Bu proje ile yüzbinlerce kitap, dergi, gazete ve milyonlarca arşiv belgesi günümüz Türkçesine hızlı bir şekilde aktarılabilecektir.”

'RESİMDEN METİNE DÖNÜŞÜM DE SAĞLANIYOR'

Osmanlıca belgelerin günümüz Türkçesine çevrilmesi için birden fazla çalışma yürüttüklerini söyleyen Dr. İshak Dölek ise “Osmanlıca OCR işleminin yanı sıra Osmanlıca-Türkçe alfabe çevirisi, Osmanlıcadan günümüz Türkçesine dil çevirisi, rika OCR yani Osmanlıca el yazısının OCR ile resimden metne dönüştürülmesi gibi diğer projelerde de çalışmaların devam ettiğini” söyledi ve “Örneğin Arapça tabanlı Osmanlı alfabesindeki Osmanlıca bir metni Latin tabanlı Türk alfabesine dönüştüren alfabe çevirisinde yüzde 75’lik bir doğruluk oranına eriştik. Alfabe çevirisi uygulamamız halen internette hizmet veren tek uygulamadır” dedi.

3 BİN KELİME 23 BİN HARFTEN OLUŞAN VERİ

Dölek açıklamasının devamında, “Osmanlıca nesih hattında yazılmış 21 sayfa 3 bin kelime ve 23 bin harften oluşan orijinal bir Osmanlıca veri seti ile test edilen OCR uygulamasında yüzde 96 başarı elde ettik. Yani her 100 adet harfin 96 tanesi uygulama tarafından doğru olarak tanındı ki bu şimdiye kadar elde edilmiş en yüksek doğruluk oranı oldu. Bu testlerde uygulamamızı dördü yurt dışından birisi yurt içinden olmak üzere beş farklı OCR uygulamasıyla karşılaştırdık ve sonuçları uluslararası bir konferansta bildiri ve dergide makale şeklinde yayınladık.

Ar-Ge faaliyetlerine devam ettiğimiz uygulamamızın sosyal bilimlerde yapacağı katkıdan dolayı mutluyuz. Şu ana kadar Osmanlica.com adresindeki OCR uygulamamızı 20 binden fazla, alfabe çevirisi uygulamamızı da 100 binden fazla kullanıcı denedi” ifadelerini kullandı.

İlk yorum yazan siz olun
UYARI: Hakaret, küfür, rencide edici cümleler veya imalar, inançlara saldırı içeren, imla kuralları ile yazılmamış, Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar onaylanmamaktadır. (!) işaretine tıklayarak yorumla ilgili şikayetinizi editöre bildirebilirsiniz.

İlgili Haberler

ABD’deki Gazetecilik Yasası kriz çıkardı: Facebook’tan haberleri kaldırırız
Avrupa’nın Ortadoğu kitapçısı ekonomiye yenildi
Türkiye’nin görsel hafızası şimdi cepte

Kültür Sanat Haberleri