İş insanı Murat Ülker, pazarlama alanında kullanılmaya başlanan 'ses istihbaratı' endüstrisine değinerek bu alanın amacının tüketicileri doğrudan ikna edebilmek ya da ikna edebilecekleri ortamı yaratmak için ses tonları ve konuşma kalıplarını analiz etmek olduğunu yazdı.
İş insanı Murat Ülker Linkedln hesabından 'ses istihbaratı endüstrisi' üzerine bir yazı kaleme aldı. Ülker yazısında Joseph Turow'un 'Ses Avcıları: Pazarlamacılar Duygularınızı, Özel Verilerinizi ve Cüzdanınızı Ele Geçirmek İçin Sizi Nasıl Dinliyor?' kitabı üzerinden bulunduğu değerlendirmelerde söz konusu endüstrinin detaylarını ele aldı.
Murat Ülker 'Ses espiyonajı (istihbarat) endüstrisi' başlıklı yazısında şu ifadeleri kaydetti:
Bilmem bilir misiniz, sesimiz de tıpkı parmak izimiz gibi, biriciktir. Ancak sesimiz, parmak izimize kıyasla hakkımızda çok daha fazla bilgi verir; içerisinde karakterimize yönelik bir takım ipuçları saklıdır. “Ses Avcıları: Pazarlamacılar Duygularınızı, Gizliliğinizi ve Cüzdanınızı Ele Geçirmek İçin Sizi Nasıl Dinliyor? isimli kitabın (*) yazarı Joseph Turow’un “ses istihbaratı endüstrisi” olarak tanımladığı sektör, sesin biyometrik olduğu temeline dayanan varsayımını destekleyecek güçlü kaynaklara ve ölçümlerini gerçekleştirebilecekleri son nesil teknolojilere sahip. Temel meşgaleleri tüketicileri doğrudan ikna edebilmek ya da ikna edebilecekleri ortamı yaratmak için ses tonları ve konuşma kalıplarını analiz ederek duygular ve kişilik özellikleri hakkında fikir sahibi olmak.
SEKTÖRÜN EN ÖNEMLİ OYUNCUSU AMAZON VE GOOGLE
Bu sayede birkaç telefon görüşmesinin ardından müşterileri seslerine göre segmente edebilir; yarar veya yaramaz olarak sınıflandırabilir, karşısına sizin hoşunuza gidebileceğini düşündüğü ürünleri çıkartabilir ve hatta aynı ürün için size başkasına teklif ettiğinden daha yüksek ya da daha düşük bir indirim teklifi sunabilir. Bu ayrımları yapabilmek için kayıt altına alınan bir görüşmede iki kelam etmeniz ve bunu belirli modellemeler üzerinden değerlendirerek bir sonuca varmaları yeterli. Yani hangi aplikasyonu hangi amaçla, ne zaman, nerede kullandığınız ve hatta o anda başka ne ile meşgul olduğunuzu ortam dinleme ile tespit ederek yapıyorlar. Düşünmesi dahi ürkütücü gelebilir, işte bu yüzden konu hakkında bilgilenmemiz gerekiyor.
Joseph Turow, eğer sektörde bir düzenleme yapılacak ve gerekli politikalar hayata geçirilecek ise buna şimdi başlanmalıdır, diyor ve ardından kitabın amacını şu şekilde belirtiyor: Henüz gelişmekte olan bu alanı anlatmak, yaşamlarımızı şimdiden nasıl etkilediğini açıklamak, alınması gereken aksiyonları belirtmek, durdurulması gereken uygulamaların altını çizmek ve ivedilikle hayata geçirilmesi gereken regülasyonlara ışık tutmak.
Apple’ın Siri’si, Amazon’un Alexa’sı, Microsoft’un Cortana’sı ve daha birçoğu… Bunlar sesimiz ile komut alan ve verilen komutu yerine getiren cihazlar, yani yapay zeka temelli “akıllı asistanlar” olarak tanımlanıyor. Yazar, sektörün en önemli oyuncularının Amazon ve Google olduğunu belirtiyor ve bu araçların maksimum pazarlama potansiyelini henüz kullanmadıklarını; çünkü insanların seslerinin açıkça toplanması konusunda toplumsal korkuları ve ardından muhtemel tepkileri alevlendirmekten endişe ettiklerinin altını çiziyor. Peki Google ve Amazon sektörü bir sonraki aşamaya taşıyamıyorsa (henüz), bu sektörün yerinde sayacağı mı anlamına geliyor? Hayır.
SESİMİZ PAROLAMIZ
Arama merkezleri (call center), Apple ve Amazon gibi göz önünde olan şirketlerin aksine halkı rahatsız edebilecek bir takım uygulamaları hayata geçirebilir ve kolaylıkla sektörün yönünü bu doğrultuda değiştirebilir, diyor yazar. Kendi sesli asistanlarını geliştiren mağazalar, bankalar ya da çeşitli kurumlar müşterilerin neyi ne şekilde söylediğini kolaylıkla kayıt altına alabilir, belirli modellemelerin içerisine koyarak sınıflandırabilir ve konuşmanın çıktısını da fonksiyonun içine dahil ederek bir “sonuca” varabilirler. Bu sonuç, sizi kategorize etmeye yarar ve diğer araştırma metodlarına bakıldığında oldukça bütçe dostudur. Dr. Turow arama merkezlerinin başlatacağını öngördüğü bu değişim sürecinin bir noktasında, tepkilerden çekinen Amazon ve Google’ın da onlara katılmaya “mecbur” hissedeceğini ifade ediyor (Ben burada yüksek sesle güldüm).
Yazar sesli istihbarat endüstrisi olarak tanımladığı sektörün günümüzdeki konumunu “ölçeklendirme” (ticarileştirme) olarak tanımlıyor. Şu anda temel olarak sesimizi, kendimiz olduğumuzu kanıtlamak için kullanıyoruz; sesli imzalar gibi, sesimiz bir nevi parola görevi görüyor. Turow’un görüşlerine göre sektörde yaratılan değerler birçok insanın hayatının vazgeçilmezlerinden biri haline geldiğinde, yani mühendisler veriyi anlamlı bir bütüne dönüştürmenin en iyi yolunu bulduktan sonra, ölçeklendirme dönemi sona erecek. Ardından başlayan dönemde ise topladıkları ses verilerinin profillerini oluşturmak ve ses temelli segmentasyon sayesinde müşteriler için özelleştirilmiş teklifler, agresif bir şekilde kullanılmaya başlanacak (Turow’un kitabının basım tarihi Mayıs 2021, şu anda bunlar zaten yapılır hale geldi)
Peki kullanıcılar olarak biz, kontrolü nasıl elimizde tutabiliriz? Kişisel özgürlüğümüzü farkına varmadan diğerlerine teslim etmememizin bir yolu var mıdır? Evet, bilgilenmemiz gerekiyor, sektörün pazarlama dünyasına yön veren stratejilerinin temellerini öğrenmemiz gerekiyor. Yazar sektörde yoğun olarak kullanılan, birbirleri ile sıkı sıkıya bağlı olan 4 temel stratejiyi tanımlıyor ve örnekler ile devam ediyor:
Kişiselleştirme Sarmalı (Spiral of Personalization): Ürün, hizmet, içerik ya da teklif size “özel” olarak sunulur.
Karşı Konulamaz Gözetim: (Seductive Surveillance): Teknolojik cihazların cazibesi artırılarak insan teknolojileri “ister” hale getirilir.
Alıştırma (Habituation): Bir takım faydalar ve üretilen değerler ile insanların izleme teknolojilerine alışma süreçlerine yardımcı olunur.
Boyun Eğme, Teslimiyet (Resignation): İnsanlar dijital dönüşümün ve dijital gözetimin kaçınılmaz olduğuna, ya da en azından “ortada o kadar da büyük bir problem olmadığına” ikna edilir. Teknoloji zaman içerisinde gelişmeye devam eder.
BİREYİN SESİ VE KİLOSU ARASINDA BAĞ VAR
Günümüz “ölçeklendirme” çağındaki durum, bize ulaşan kişinin ihtiyaçlarını şirketin çıkarları doğrultusunda, yani verimli bir şekilde ele almak için, yapay zeka rehberliği sağlamaktır. Karşı konulamaz gözetim durumu işte bu noktada devreye girer, çünkü şirketlerin kullandıkları bu yapay zeka rehberleri son derece derin bir öğrenme sistemine sahiptir. Bu yapay zeka müşterilerin şirket ile temasa geçtiği noktalarda, zaman içerisinde geliştirdiği bir öğrenme mantığı ile müşteri davranışlarını ve motivasyonlarını nicel ve nitel verileri birleştirerek analiz eder. Duruma ilk etapta baktığımızda belki yukarıdaki adımların hiçbiri ile doğrudan uyuşmadığını görebiliriz. Ancak burada ulaşılması istenilen sonuç, kişiselleştirme sarmalının aşırı bir versiyonunu yaratmaya yardımcı olmak için (1. Adım), karşı konulamaz gözetimi (2. Adım) kullanmaktır. Çünkü toplanan, işlenen ve analiz edilen her verinin amacı; kurumların kişiyi kendisini tanıdığından daha iyi tanımalarını sağlamaktır. Eğer bu amaç yerine getirilebilirse, ses temelli çalışan teknolojilere giderek daha fazla güvenilir hale gelirken; sesleriniz aracılığı ile aktardığınız verilerin kurumsal sunumlarda sizin için kişiselleştirilmiş tekliflere dönüşmesi an meselesi olacaktır.
Bu durum ilk bakışta faydalı olarak görünebilir. Nitekim yaşadığımız bir takım sorunları daha çabuk çözebilir ya da o an ihtiyaç duyduğumuz herhangi bir ürüne daha uygun bir fiyata ulaşabiliriz. Ancak madalyonun diğer yüzü pek de iç açıcı değil. Bu durum yüz milyonlarca insanın bu tür kişiselleştirilmiş seçimlerle karşılaştığı milyarlarca farklı durum ile çarpıldığında, şu anda muzdarip olduğumuz “yankı odalarımız”, kolaylıkla “yankılı bir iç ses” haline gelebilir ki bu durum son derece problemli sonuçları beraberinde getirecektir. Yani boyun eğme, teslimiyet evresi. Bunlar geleceğe dönük karamsar görüşler olarak görünüyor olabilir. Ancak makine öğrenmesi temelli çalışan bu araştırma metodunda (süre ilerledikçe daha doğru ve verimli sonuçlara ulaşacağı anlamına gelir) günümüzde hangi bilgilerinizi sesiniz aracılığı ile “sızdırdığınızı” öğrenince şaşırabilirsiniz.
Bireyin kilosu ve sesi arasındaki ilişkiyi kanıtlayan birçok çalışma varmış. Kilosu fazla olan erkekler daha yüksek bir ses ile konuşurken; kilosu yüksek olan kadınlar daha düşük bir ses ile konuşurmuş. Çalışmalar sayesinde araştırmacılar, seslerin frekanslarına bakarak beş yaşındaki çocukların ağırlıklarını bile tahmin edebiliyorlarmış.
Daha uzun boylu insanlar, ortalama olarak daha uzun ses yollarına ve daha büyük akciğerlere sahip oldukları için farklı bir ses çıkarırlarmış.
Ses, bir kişinin kalp atış hızını belirleme konusunda yeterli değil. Araştırmacılar bunun sebebini adrenalin seviyesi gibi çeşitli stres etkileriyle bağdaştırıyorlar.
Sesin sistematik eksiklikleri, bazı hastalıkların biyobelirteçleri görünüyor. Lou Gehrig hastalığı olarak da bilinen amyotrofik lateral skleroz (ALS) geliştiren kişiler, Parkinson hastalığından farklı ses eksikliklerine sahipmiş ve bu da bunama hastalarının ses eksikliklerinden farklıymış. Birçok endokrin bozukluğunun da karakteristik ses biyobelirteçleri varmış.
Depresyon, şizofreni ve intihar riski gibi psikiyatrik hastalıkların belirli ses biyobelirteçleri varmış.
Doğum kontrol hapı kullanımı vücudun hormonal seviyelerini değiştirdiği için kadınların sesini de değiştirmiş. Araştırmacılar bu değişiklikleri, sesin "aralığı" ve "kalitesine" ilişkin nicel ölçümlerde saptayabiliyorlarmış.
Ses sayesinde araştırmacıların bir kişinin hareket halindeyken mi yoksa dururken mi konuştuğunu saptayabilmeleri de mümkünmüş.
Ya sesin , bir kişinin genel olarak sağlıklı mı yoksa sağlıksız mı olduğu konusunda önemli ipuçları saklamasına ne diyorsunuz!. Sağlığı iyi olan insanlar, önemli ölçüde daha yüksek sesli harflere, daha geniş bir ses çıkarma becerisine ve seslerinde daha düşük titreme seviyelerine sahipmiş.
Makine öğrenmesi temeli ile çalışan bu sistemde; makine her geçen gün daha fazla anlamlı ilişkiler ve korelasyonlar yakalayacak; bunun sonucunda çıkarımlar her geçen gün daha da artacak görünüyor. Günümüzde kuruluşların normal ticari faaliyetleri sırasında topladıkları ancak şu anda kullanmadıkları ya da belirli sebeplerden dolayı kullanamadıkları “dark data” (karanlık veri) işte bu şekilde her geçen gün daha da anlamlı ve “işe yarar” hale gelecektir.
Şimdi günümüzde sektörün en önemli oyuncuları olan Amazon ve Google’ın “Akıllı Asistanlarını” Amerika Birleşik Devletleri vatandaşlarına pazarlarken hangi taktikleri kullandıklarına bir göz atalım. Yeri gelmişken söylemekte fayda görüyorum, bu cihazlar Türkiye’de de hizmet vermeye başladığında son derece farklı stratejiler görebiliriz.
Amazon ve Google’ın ilk olarak başarmak istedikleri hedefleri akıllı asistanların günlük hayatın vazgeçilmez bir parçası olarak konumlandığı yeni bir düzen yaratmak. Yazara göre bu amaç etrafında iki marka kıyasıya rekabet halinde. “Benim asistanımı satın almalısın.” Ancak bu rekabetin dışında, zincirleme etki yaratmasını umdukları üç ortak sosyal hedef için uyum içinde birlikte çalıştıklarının altını çiziyor:
Akıllı asistanları yeni hayatın vazgeçilmezlerinden birisi olarak konumlayarak dünyayı bu cihazları almak için “ikna etmek”,
Cihazların gözetleme ve takip konusunda tüketicilerin sahip olabileceği muhtemel endişeleri “hafife almak, aldırmak”,
En nihayetinde dünyayı zaman ve ortam fark etmeksizin doğrudan seslerini kullanarak işlem yapmaya “alıştırmak”.
Yazara göre Google ve Amazon bu amaçlarını gerçekleştirme yolunda kimi zaman kendi başlarına yürüyor, kimi zaman ise “ses istihbaratı” sektöründeki diğer oyunculardan destek alıyor. Tüm sektör, ses teknolojilerinin toplumun kilit alanlarına yayılmasını ve bunun ardından zamanla gelişecek olan alışkanlığı teşvik ediyor. Tüketicileri kimi zaman düşük fiyatlar ile, kimi zaman “daha iyisine sahip olma” teşviği ile, kimi zaman ise “kişiselleştirilmiş ve akıllı bir asistan” fikri ile - sonucunda akıllı bir asistana sahipseniz önemli bir iş yapıyor olmalısınız - ürünü satın almaya teşvik etmek için çaba gösteriyorlar.
Yazar, gelecekte hayata geçirilmesinin gerekli olduğunu savunduğu regülasyonları aşağıdaki gibi sıralıyor; ve kitabında sürekli olarak değindiği üzere, müşteriler olarak bizim de sesimizi paylaşma konusunda daha bilinçli, tedbirli ve isteksiz olmamız gerektiğinin altını bir defa daha önemle çiziyor.
Hayatımızı kolaylaştıran sesli kimlik doğrulama teknolojisi sürdürülmelidir; ancak sektör oyuncuları, kullanıcılara mutlaka seslerinin hangi amaca hizmet üzere hangi araçtan nasıl toplanıp kullanılacağı hakkında detaylı bilgi sunmakla yükümlü olmalıdır. Ayrıca kullanıcıların ses kayıtlarının istedikleri zaman sistemden silinmesini sağlayacak bir araç da sağlamalıdır. Bir devlet kurumu tarafından kişinin bilgisi olmadan sesli kimlik doğrulamanın kullanılması ve ardından verinin depolanması mahkeme izni gerektirmelidir.
Sesle tanımlama, yani biyometrik olarak sınıflandırılmış geniş bir topluluk arasından spesifik olarak “bir bireyin” kim olduğunu belirlemeye yarayan teknoloji, sadece kolluk kuvvetlerinin kullanabileceği bir araç olmalıdır ve yalnızca belirli bir bireyi aramak için izin ile kullanılmalıdır. Ses tanımlama teknolojisinin ticari faaliyetler genelinde kullanımı yasaklanmalıdır.
Ses profili oluşturma, yani bir bireyin sesinin özelliklerine dayalı olarak onun hakkında çıkarımlarda bulunma işlemi, tek başına kullanılabilir. Ancak, özel kurumların bireylerle olan etkileşimlerinde, tüm ses profilleri kesinlikle yasaklanmalıdır. Cezai veya ulusal güvenlik nedenleriyle meydana gelebilecek istisnai durumlar, yalnızca biyometrik faaliyetlerin yürütülmesi ve sonuçları konusunda özel uzmanlığa sahip bir mahkeme tarafından yürütülmelidir.
Bahsi geçen bütün sınırlandırmalar, siyasi kampanyalar ve çoğu hükümet faaliyetlerini de kapsamalıdır.
Bir bireyin geçmiş yaşantısını, geçmişte ya da şu anda meşgul olduğu faaliyetlerini, kişiliğini, duygularını veya duyguları hakkında sonuçlar çıkarmak için konuşma kalıplarını kullanmayı amaçlayan dilbilimsel analizler için ses transkriptlerinin kullanılması, ses biyo-profilleme ile aynı regülasyonlar ile sınırlandırılmalıdır.
Kitabın yazarı Turow’u bir ses verisi aktivisti olarak tanımlamak hiç yanlış olmaz. Konunun geleceği hakkında pek de olumlu düşündüğünü söyleyemeyeceğim. Kendisine göre eğer bir aksiyon alınacak ise, bu şu anda yapılmalı. Çünkü eğer harekete geçilmez ise; “pazarlamacıların ve hükümetlerin agresif bir şekilde kullanacağı biyo profilleme yüzünden gelecek nesillerimize onların kim olduklarını, neye inandıklarını ve neyi istediklerini bilen; ve en nihayetinde insanların özgür seçim yapma özgürlüğünü aşındıracak olan bir çağa giriş yapabiliriz”. Yazarın görüşleri ve ifade biçimleri kimi zaman karamsar görünüyor olabilir, hatta bazılarımız için radikal olarak tanımlanabilir. Ancak ben kendisinin söylediklerine kulak vermekte büyük fayda görüyorum. Hepimiz verinin gücü ve potansiyeli ile Facebook - Cambridge Analytica davasında karşılaştık.
Demek ki pek yakında, ne konuştuğunuzdan değil de nasıl konuştuğunuzdan (ses analizi) kim/nasıl birisi olduğunuz, siyasi/ticari/dini eğiliminiz ve kim bilir daha neler anlaşılacak. Maazallah devletler pardon troller ne kadar “vatansever” olduğunuz iddiasına vardırabilirler işi!
Toparlamak gerekirse; ben öncelikle konu hakkında belirli bir bilinç seviyesine ulaşmamız gerektiğini düşünüyorum. Örneğin finansal durumunuzu ve kararlarınızı yönetebilmek için “finansal okuryazarlığa” sahip olmanız son derece önemlidir. Aileler yıllardır çeşitli teknikler ile çocuklarına bu yetiyi kazandırmaya çalışıyorlar, öğretmenler derslerde bahsediyorlar. Çünkü finansal konular ve kararlar hakkında yeterince bilgiye sahip olmayan nesillerle, bireysel ya da küresel ölçek fark etmeksizin; bir ekonomi yönetilemez. Ama “veri” konusunda henüz bu bilince ulaşabildiğimizi söyleyebilmek zor…
Müphemliği ele aldığım daha önceki yazılarımda bahsetmiştim, insan bilmediği olgulardan korkar ve uzaklaşır. Detaylarını bilmediğimiz, dinamiklerini bilmediğimiz bir konuya, özellikle de işimize yarıyor ise, ayak uydurma eğiliminde oluruz. “Hayır” diyebilmemiz zorlaşır. Sizce ettiğimiz iki kelamın bu kadar karmaşık analizlerden geçip her çeşit amaca hizmet edecek şekilde kullanılabildiği, dijital ortamda yaptığımız her tıklamanın ya da kaydırmanın kaydının tutulduğu ve bir takım amaçlar doğrultusunda kullanıldığı, Web 3.0’ın teknolojinin gündeminde oturduğu bu çağda kendimizi ve nesillerimizi “veri okuryazarlığı” konusunda yeterince eğitebiliyor muyuz? En basitinden internetteki deneyimimizi kolaylaştırmak için kayıt altına alınan “çerezlerin” (cookies) hepsini kabul edip (ben ediyorum, çünkü daha iyi hizmet almak istiyorum) geçiyor muyuz? Bu çerezlerin yolculukları hakkında bilgi sahibi miyiz? Siz neler yapıyorsunuz, bu önemli konuda yorumlarınızı bekliyorum.
Bu arada ChatGPT henüz sadece metin yoluyla sorgulamaya izin veriyor. Gelecekte ne olacağını sanırım tahmin ediyorsunuzdur! General Motor araçlarında ChatGPT temelli ses asistanlarının kullanılacağı şimdiden açıklandı bile..Sesle aktive edilen alarm (emergency) sistemlerini biliyorduk ama yapay zekanın sesle aktivasyonunun ne olduğunu hep birlikte göreceğiz. Anlayacağınız 80’li yılların ünlü dizisi (yaşım ortaya çıkıyor) Kara Şimşek’teki sesle komut alan araç gerçek oluyor. Ama seslerimizin geleceği meçhul! (**)