Veri bilimi yol haritası

İki hafta boyunca veri biliminin ehemmiyetinden bahsedip bugün petrol ve elektrik hayatımızda ne kadar önemliyse büyük veri ve veri biliminin de 21. yüzyılda petrol ve elektrik kadar önemli olacağını söylemiştik. Bu hafta bir veri bilimcisinin yol haritasını çıkarıp, kimlerin veri bilimcisi olabileceğini anlatmaya çalışacağız.

Geçen hafta (19-22 Mart) Las Vegas’ta IBM’in yapay zeka platformu IBM Watson’ın tanıtım toplantıları yapıldı. 4 gün süren konferanslarda her 25 yılda bir iş ve teknolojinin eksponansiyel atlama yaptığı ve şu an yapay zeka ve veri bilimiyle yeni bir sıçramanın başlangıcında olduğumuz vurgulandı. IBM’in CEO’su Ginni Rometty ise yeni dönemin robotların ve insanların karşı karşıya değil, insanların ve makinaların beraber çalışarak, bireylerin yapay zeka ve veri analizleriyle güçlendirileceğini ve yapay zekanın bütün meslekleri yüzde 100 değiştireceğini belirtti. Amerika’nın en büyük cep telefonu operatörlerinden Verizon’ın CEO’su Lowell McAdam ise 5G teknolojisine geçildiğinde akıllı telefonların ayda bir, IoT cihazlarının ise 5 yılda bir şarj edileceğini ve 5G+Yapay Zeka+Bulut’un bir sonraki sanayi devrimini başlatacağını söyledi.

***

Şahsi kanaatime göre biz Türkiye olarak son iki asırda gerçekleşen sanayi devriminde ve ardından gelen digital devrimde hem hazırlıksız yakalandık, hem de treni kaçırdık. Ancak önümüzde altın bir fırsat var. O da yapay zeka, akıllı makinalar ve veri bilimi.

16 yıldır yurt dışında çalışıyorum. Bu sebeple akrabalarımın önemli günlerinde yanlarında olamadım. Fakat 2012 yılında Türkiye ziyaretimde bir düğüne katıldım. Akrabalarımızdan bir hanım düğünde takı olarak kimin ne taktığını, insanların yüz ifadesinden gerçekten mutlu mu olduğunu yoksa kıskandığını mı yüzde 100 doğrulukla biliyor ve düğüne katılan yaklaşık 1000 kişinin ailecek mi, yoksa tek başına mı geldiğini ayrıntılarıyla anlatıyordu. Kimin ne söylediğini, aslında ne söylemek istediğini hem de yüz okuma ve sentiment analizleriyle beraber biliyordu. Görüldüğü gibi veri bilimine çok da yabancı değiliz. Şirket ve kurumların bu düğündeki takıları yüzde 100 doğrulukla bilen kadın akrabamız gibi verileri düzgün tutması gerekiyor. Bundan sonrası çok basit, 7’den 70’e herkes veri bilimcisi olabilir. Üstelik fabrikalar kurmaya, milyarlarca liralık yatırımlar yapmaya gerek yok. Tek lazım olan şey bir adet bilgisayar ve internet erişimi.

***

Veri bilimci olmak için ilk yapılması gereken şey sağlam bir irade ve öğrenmeye açık olmak. Sonra Python veya R programlama dillerinden birini öğrenmek. Şahsi tercihim Python’dan yana. Çünkü Python son derece kolay ve hazır kütüphaneleri çok geniş. Üstelik bilim adamları çoğu kez Python kullanıyorlar ve kütüphanelerinin gelişmesine katkıda buluyorlar. Başka programlama dilleriyle günler harcayarak yazdığımız programlar Python da tek bir satırlık koda indirgenmiş vaziyette. Bu da müthiş bir kolaylık sağlıyor ve zaman kazandırıyor. Bunun üzerine Python’un en meşhur kütüphanesi Pandas ve verilerin grafiklerle görselleştirilmesini sağlayan Matplotlib ve Seaborn’u öğrenmek gerekiyor. Bütün bunların hepsini kendisinde toplayan yazılım ‘Anaconda’. Bu program kurulduktan sonra tek bir tıklama ile çalıştırılan Jupyter Notebook en temel ve en önemli aracımız.

Programlama dilini öğrendikten sonra birazcık matematik, SQL ve istatistik bilmek gerekiyor. Bundan sonra geriye makina öğrenmesi (machine learning) algoritma ve tekniklerini öğrenmek lazım. Mesela tahmin etmeye çalıştığımız hedef ‘fiyat veya bir rakamsa’ regresyon (regression) algoritmalarını, ‘cevabı evet veya hayır olan’ hedef ise sınıflandırma (classification) ve ‘cevabı hangi gruba dahildir’ olan ise gruplandırma (clustering) algoritmalarını kullanmamız gerekiyor. Bu algoritmaları programlamak zorunda değiliz. Bunlar zaten birileri tarafından yazılmış ve hazır paket haline getirilmiş. Bize düşen verilerimizi öğrenme ve test için ikiye ayırıp bu algoritmalardan birini çağırıp çalıştırmakla işimiz bitmiş oluyor.

***

Makina öğrenmesi tamamlandıktan sonra derin öğrenme (deep learning), Tensorflow, doğal dil anlama (NLP), yüz tanıma sistemleri, OpenCV ve yazıların duygusal analizini yapan ve ne demek istediğini anlayan sentiment analizi öğrenmek standart bir veri bilimcinin yol haritasıdır.

Bir veri bilimcinin en iyi arkadaşı ww.kaggle.com olmalıdır. Çünkü Kaggle’da hem örnek veri kümeleri (dataset) bulunabilir, hem de hazır kodlardan yararlanılabilir. Ayrıca Kaggle veri bilimi üzerine yarışmalar yapmakta ve milyonlarca dolar ödül dağıtmaktadır. Kendine güvenen veya güvenmeyen veri bilimcileri bu yarışmalara katılıp yüklü miktarlarda kazanç sağlayabilirler. Yukarıda ismi geçen programların tamamı açık kaynak yani ücretsiz olup internetten ufak bir araştırma ile hepsine kolaylıkla ulaşılabilir.

***

Görüldüğü gibi bir sonraki teknoloji devrimini yakalamak elimizde ve öğrenmek çok basit. Bütün işletmeler derhal elemanlarına veri bilimi ve analizi öğretmeli, gazeteciler büyük veri ve veri bilimini öğrenip bilimsel metot kullanarak, sağlam delillere dayanan haberler yapmalıdır. Bütün üniversiteler veri bilimi sertifika programları açmalı, bilgisayar dershaneleri derhal veri bilimcisi yetiştirmeye başlamalıdır.

İsminizi Güneş’e göndermek ister misiniz?

NASA bu yılın Ağustos ayında doğrudan Güneşe gidecek olan Parker Güneş Sondası”nı uzaya fırlatıyor. Bu uzay aracının içine yerleştirilecek olan bir mikroçip Dünya genelinden gönderilen isimleri de beraberinde Güneş’e götürecek. Siz de isminizi göndermek isterseniz http://go.nasa.gov/HotTicket linkine tıklayıp adınızı, soyadınızı ve email adresinizi girin ve gelen emaildeki linke tıklayıp, onaylayın. Size ikinci bir email gelecek ve o email de hem sertifika numaranızı, hem de isminizin Güneş’e gönderildiğini gösteren sertifikanızı pdf formatında indirilebileceğiniz linki göreceksiniz.

Parker Güneş Sondası Dünyamıza en yakın yıldız olan Güneş’in henüz çözülemeyen sırlarını aydınlatmaya çalışacak. Güneş’e yaklaşık 6 milyon km yaklaşacak olan uzay aracı Güneş rüzgarlarını, koronaları, Güneş rüzgârlarının kaynağını ve Güneş’in manyetik alanını araştıracak. Güneş’in yüzeyi 6000 °C. Ancak Güneş’ten çok uzakta olan korona tabakası 20 milyon °C. Normalde ısı kaynağından uzaklaştıkça ısı düşer. Mesela köy yerinde kış günü harıl harıl yana sobadan uzaklaştıkça ısı düşer. Fakat Güneş’te bu tam tersi.

Uzaklaştıkça ısı artıyor ve 20 milyon dereceye kadar çıkıyor. İşte Parker Güneş Sondası Güneş’in korona tabakasındaki bu yüksek sıcaklığın sebeplerini araştıracak. Uzay aracı Güneş’e çok yaklaştığı için 1300 dereceye dayanıklı olarak tasarlandı ve Güneş ışınlarından elektrik elde edip kendisini soğutarak hayatta kalmaya çalışacak.Yazımıza üstat Necip Fazıl’ın bir mısrasıyla son verelim:

Yeryüzü boşaldı, habersiz miyiz?

Güneş’e göç var da, kalan biz miyiz?

YORUMLAR (4)
YORUM YAZ
UYARI: Hakaret, küfür, rencide edici cümleler veya imalar, inançlara saldırı içeren, imla kuralları ile yazılmamış, Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar onaylanmamaktadır. (!) işaretine tıklayarak yorumla ilgili şikayetinizi editöre bildirebilirsiniz.
4 Yorum