Yapay Öğrenme - Ethem Alpaydın

Yapay öğrenme, bilgisayarların bir problemi çözmekte örnek veri ya da deneyimi kullanacak biçimde programlanmasıdır. Yüz tanıma, konuşma tanıma, istenmeyen e-postaların süzülmesi, kredi risk hesabı, müşteri bölütleme gibi uygulamalar yanında yapay zekâda, robotikte, biyoinformatikte, doğal dil işlemede son yıllarda büyük miktarda veriyi işleyerek bilgi çıkartan yapay öğrenme yöntemleri her gün daha çok öne çıkmaktadır. Kapsamı oldukça geniş olan bu kitapta, gözetimli, gözetimsiz ve pekiştirmeli öğrenme için kullanılan tüm yaklaşımlar, olasılık tabanlı modeller, yapay sinir ağları, karar ağaçları, saklı Markov modelleri, çekirdek makineleri, Bayesçi yöntemler ve çizgesel ağlar işlenmekte, ayrıca boyut azaltma, öbekleme, model birleştirme, deney tasarımı veçözümleme gibi konular ayrıntılı olarak tartışılmaktadır. Tüm yöntemler, okuyucunun gerektiğinde denklemleri bilgisayar programına kolayca dönüştürebilmesini sağlayacak düzeyde ele alınmaktadır.
(Tanıtım Bülteninden)

Prof. Dr. Ethem Alpaydın: Sanki yapay zekâ gerçek oluyor
Türkiye Bilişim Derneği (TBD) Bilişim Dergisi yeni sayısında yapay öğrenme konusunda önemli çalışmalar yapan Boğaziçi Üniversitesi Bilgisayar Mühendisliği Öğretim Üyesi Prof. Ethem Alpaydın ile ?Yapay Öğrenme? adlı Türkçe baskısı gerçekleştirilen ?Machine Learning? kitabı üzerine bir söyleşi gerçekleştirdi.

İnternete erişim kurallarının sıkılaştırılmasıyla yanlışların çoğalacağına ve kuralların etrafından dolaşılıp saygınlığının kalmayacağına işaret eden
Alpaydın, filtrelemenin isteğe bağlı olmasından yana. Hesaplama ve bellek gücü arttan, büyük miktarda veriyi işleyip bundan kural çıkarabilen programların ?zeki? davrandığını bildiren Alpaydın, yapay zekânın gerçekleşmeye başladığını, bu konu yapay öğrenme yöntemlerine önemli rol düştüğünü vurguladı.

?İnsan beyni, görebilen, konuşabilen, öğrenebilen bir donanım gerçeklemesidir? diyen Alpaydın, mühendislerin bu hammaddeye uygun başka bir donanım gerçeklemesi oluşturabileceğine dikkat çekti. Kendi kendini kullanan otomobiller üzerinde çalışıldığını anlatan Alpaydın, en çok on yıl içinde bunun gerçekleşeceğini tahmin etti.

-Öncelikle, okuyucularımıza kendinizi kısaca tanıtabilir misiniz?

-1966, Malatya doğumluyum. 1983 yılında Kadıköy Anadolu Lisesi?ni, 1987?de Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü?nü bitirdim. 1990 yılında İsviçre Ecole Polytechnique Fédérale de Lausanne?dan doktora derecemi aldım. 1991?de International Computer Science İnstitute (ICSI),
Berkeley?de doktora sonrası araştırmacı olarak çalıştıktan sonra mezunu olduğum Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölüm??ne öğretim üyesi olarak katıldım. Halen aynı bölümde Profesör olarak çalışıyorum. Bu süre içinde MIT, ICSI ve İsviçre Idiap?a misafir araştırmacı olarak ziyaretler yaptım. Boğaziçi Üniversitesi Vakfı araştırmada Üstün Başarı Ödülü?nü 1998 yılında genç, 2008?de ise kıdemli öğretim üyesi olarak aldım. 1997?de Fulbright Senior Scholar, 2001?de Türkiye Bilimler Akademisi Gebip ve 2002?de Tübitak Teşvik ödüllerine layık görüldüm.

-Bugünlerde çok popüler bir konu olan İnternet?te filtreleme ile ilgili görüşleriniz nedir? Bilgi Teknolojileri ve İletişim Kurumu (BTK), kelime bazlı filtreleme yapıyor? Yani tek başına uygunsuz bir kelime başka bir kelimenin içinde geçtiği zaman, o kelime de uygunsuz kelime olarak filtreleniyor. Bu sorunla ilgili görüşleriniz ve çözümlerinizi alabilir miyiz?

-Sözcük bazında filtreleme yeterli olmaz. İstenmeyen e-postaların yakalanmasında bunun çalışmadığını biliyoruz. Siz ne kural koyarsanız koyun karşı tarafta birileri onu atlamak için başka bir yöntem geliştirecektir. Böyle kurallarla hem istediğiniz her şeyi yakalayamazsınız, hem de geçerlileri yanlışlıkla engelleyebilirsiniz. Sınıflandırmada bunlara yanlış eksi ve yanlış artı diyoruz; istenmeyen bir bağlantıya yanlışlıkla izin verirseniz bu yanlış artı, geçerli bir bağlantıyı yanlışlıkla engellerseniz bu da yanlış eksidir. Yanlış artılar kadar yanlış eksilerin de maliyeti vardır ve kuralları sıkılaştırdıkça yanlış eksiler çoğalır. Bu durumda herkes bir süre sonra bu kuralların etrafından dolaşmaya başlar (Youtube yasağında olduğu gibi) ve kuralların saygınlığı kalmaz. Böyle bir filtrelemenin isteğe bağlı olması gerekir; isteyen anne babalar, okullar, vs böyle bağlanır, istemeyen yetişkinlerse kendi filtrelemesini kendisi yapar, ya da yapmaz.

– Yapay Öğrenme adlı kitabı yazma ihtiyacını neden duydunuz? Bu kitap bilişimle ilgili bölümlerde ders kitabı olarak da kullanılabilir mi?

-Yapay öğrenme yöntemleri, örüntü tanıma, veri madenciliği, bilgi erişimi gibi birçok alanda son on yılda gittikçe daha yaygın olarak kullanılıyor. Bu konuda verilen dersler de bu yüzden yeni ve ders kitabı eksikliği vardı. Konu, bilgisayar mühendisliği ve istatistik arasında disiplinlerarası bir konu olduğu için içeriğini de bilgisayar mühendisliği öğrencileri için uygun bir biçimde sunmak gerekiyor. Bu kitap, benim Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü?nde verdiğim lisansüstü ders notlarım olarak başladı. Farklı kaynaklardan bilgileri birleştirip ortak bir gösterimle sununca, gerekli istatistik bilgisini ekleyip üstüne kendi araştırmalarımla edindiğim deneyimi de eklediğimde bu kitap ortaya çıktı. Kitabın aslı İngilizce ve ABD?de MIT Press tarafından birinci baskısı 2004, ikinci baskısı ise 2010?da basıldı. Türkçe çeviri, bu ikinci baskının çevirisi. Bu kitaplar, dünyada birçok ülkede hem lisans son sınıf seçmeli, hem de lisansüstü derslerde ders kitabı olarak kullanıldı ve kullanılıyor. Almanca ve Çince çevirileri de var. Bu kitabı Türkçe?ye
çevirirken amacım, Türkiye?deki üniversitelerde ders kitabı olarak kullanılmasıydı, çünkü Türkiye?deki birçok üniversitede de yapay öğrenme ya da veri madenciliği dersleri olduğunu ve bu konularda araştırma yapıldığını biliyorum. Ayrıca Türkiye?de finans kurumlarında, perakende sektöründe, telekomünikasyonda veri madenciliğiyle ilgili çalışmalar yapıldığını da biliyorum ve kitabın bu çalışmalarda da bir yardımcı kaynak olabileceğini umuyorum.

– Kitabınızın önsözünde bilim adamlarının yapay öğrenme için mühendislerin bilgisinin yetersiz olduğunu söylediklerinden bahsediyorsunuz. Burada ne demek istiyorsunuz? Biraz açabilir misiniz?

-Yapay öğrenme değil de yapay zekâyı kastettim. Yapay zekânın hep, şu an için ulaşılamayan, ama bir gün yepyeni bir kuram, yepyeni bir programlama paradigması, ya da yepyeni bir teknoloji bulduğumuzda mümkün olabilecek bir amaç olduğu söylenirdi. Ama sanki bu doğru değil artık.
Elimizdeki hesaplama ve bellek gücü arttıkça, büyük miktarda veriyi işleyerek bundan kural çıkarabilen programlar oldukça ?zeki? davranmaya başladılar. Örneğin satrançta artık şampiyon bir bilgisayar programı ve veri tabanında geçmişte oynanmış çok çok büyük miktarda oyunu
saklayarak karar veriyor, birkaç ay önce IBM?in Watson sistemi, ?jeopardy? yarışma programında insanları yine çok büyük miktarda veriyi çok hızla inceleyerek yendi. Arama motorlarının, istenmeyen e-postaların süzülmesinin gittikçe nasıl iyileştiğini hepimiz biliyoruz. Sanki yapay zekâ gerçek oluyor ve bu konudaki en önemli rol, büyük miktarda veriden kural çıkaran yapay öğrenme yöntemlerine düşüyor.

– Kitabınızda geçen ?ilişkilendirme modeli? şirketlere ve müşterilere ne tür avantajlar getirecektir? Bu modeli kullanan hangi firmalar var?

-Firmalar için müşteri ilişkileri yönetimi gittikçe önemli hale geliyor. Firmalar, artık hangi ürününü hangi tür müşterinin aldığını bilmek istiyor. Firmaların bir istediği de çapraz satış yapabilmek, yani A ürününü alan müşteriye B ürününü de satabilmek. Bunun için A ve B ürünleri arasındaki ilişkinin bulunması önemli. Eğer böyle bir ilişki varsa firma, A alan ama B almayan müşterileri kazanmak için farklı stratejiler, kampanyalar, promosyonlar geliştirebilir; bu da yepyeni bir müşteri kazanmaktan çoğu zaman daha kolaydır. Bunun en büyük uygulama alanı perakende sektörüdür. Bir süpermarkete belli malları almak için giren müşteriye başka ne mallar satabilirsiniz? Ya da belli bir kitabı almak için sitenize gelen müşteriye başka hangi kitabı önerebilirsiniz? Böylece müşteri de gereksinim duyduğu ürünleri tek bir kaynaktan daha kolayca ve belki daha ucuza edinebilir.

– Yapay öğrenme ile geçmiş tecrübe ya da örnek verilerden öğrenme ve ona göre programlama sağlanırken olağan dışı durumlarda önemli olan bilgiyi kaçırmanın maliyeti nedir? Örneğin, program istenmeyen e-postaları eski örneklere göre ayırırken önemli bir postayı da bir özelliğinden dolayı spam klasörüne atabilir ve bu kullanıcının gözünden kaçması durumunda istenmeyen durumlarla sonuçlanabilir. Bu önlenebilir mi ya da yapay öğrenme olsa bile insan desteği gerekir mi?

-Bu önemli bir konu; İnternet filtreleme sorunuzda da bahsettim. Yanlış kararlar iki türlüdür ve bunların maliyetleri aynı değildir. Çok önemli bir e-postayı kaçırmanın maliyeti yüksek olabilir; bu maliyet istenmeyen 100 e-postaya boşuna bakmaktan daha maliyetli olabilir. Ya da deprem tahmini örneğini düşünün. Deprem olmayacakken ? Yarın deprem olacak? diye tahmin yaparsanız bu kötüdür, herkes boşuna paniğe kapılır, ama deprem olacakken ? Yarın deprem olmayacak? diye tahmin yapmak çok daha kötüdür. Yapay öğrenme içinde bu farklı maliyetleri göz önüne alarak karar vermek için yöntemler var. İstersek algoritma, artı ya da eksi karar vermek yanında emin olmadığı durumlar için ?şüphe? kararı da verebilir ve böylesi şüpheli örnekler bir insan tarafından incelenebilir. Postanede zarfları, üstündeki posta kodlarını okuyarak tasnif eden bir görüntü tanıma sistemini düşünelim. Posta kodu güvenle okunamayan az sayıda zarf için karar vermek yerine bunlar bir insanın önüne düşürülebilir ve insan bu zarfları posta kodu yanında başka özelliklerine göre, örneğin adresi okuyarak, sınıflandırabilir.

– İnsan beyni çalışma yapısına en uygun model olarak yapay sinir ağları gösterilmiştir. Bunların çalışma prensipleri açısından aralarındaki benzerlikler ve ayrılıklar nedir?

-David Marr, bilgi işleyen sistemlerin üç düzeyde incelenebileceğini söyler. Bunlar yukardan aşağıya, 1) Hesaplama kuramı, 2) Gösterim ve algoritma ile 3) Donanım gerçeklemesidir. Herhangi bir gösterim ve algoritma için birden çok olası donanım gerçeklemesi olabilir; aynı biçimde, herhangi bir hesaplama kuramı için birden çok gösterim ve algoritma olabilir. Örneğin sayıları sıralamak için farklı algoritmalar vardır; Heapsort, Quicksort, vs. Bu algoritmalardan herhangi birini farklı işlemciler için derlediğinizde farklı donanım gerçeklemeleri oluşacaktır, ama bu kodların hepsi aynı kuramı, sıralama işini gerçekler. Bir başka sıkça verilen örnek olarak, serçe ve Boeing 747 iki farklı donanım gerçeklemesidir, ikisi de uçar, ikisi de aynı hesaplama
kuramına, aerodinamiğe dayanır. Benzer biçimde, insan beyni, görebilen, konuşabilen, öğrenebilen bir donanım gerçeklemesidir. Eğer bu donanım gerçeklemesinden hareket ederek daha üst düzeydeki gösterim ve algoritma düzeyine, oradan da zekânın hesaplama kuramına çıkabilirsek ardından biz mühendisler bu kuramı kullanarak elimizdeki hammaddeye uygun başka bir donanım gerçeklemesi oluşturabiliriz. Doğa uçma için elindeki hammaddeyle serçeleri yaptı, bizse uçağı yaptık. İkisi de uçar ama uçak kanatlarını çırpmaz, yerine pervanesi ya da jet motoru vardır, çünkü aerodinamiğe göre önemli olan o itme gücünü vermektir, bunun tek yolu da kanat çırpmak değildir. Leonardo da Vinci?nin çizimlerinden büyük kanatlar takmış insanları hatırlarsınız ama bu bizim için doğru çözüm değil, çünkü bizim kol kaslarımız, kendi ağırlığımızı havalandıracak kanatları çırpabilecek güçte değil.

İnsan beyninin karmaşık bir ağ oluşturan sinir hücrelerinden oluştuğunu biliyoruz. Yapay sinir ağları araştırmasındaki amaç böylesi ağlar için matematiksel modeller oluşturmak ve bu ağların ne tür işleri yapabildiğini görebilmek. Yani donanım gerçeklemesinden bir üst düzeye, gösterim
ve algoritma düzeyine çıkabilmek. İstenen beynin fiziksel, kimyasal ayrıntılarından olabildiğince soyutlanmış genel bir kuram oluşturabilmek. Serçenin tüylerinin renginin uçmaya bir etkisi olmaması ama kanadının biçiminin önemli olması gibi.

-Alvinn?in modeli ile bir aracın belirli bir rota üzerinde kullanımının kaydedilerek daha sonra insansız bir araçla aynı yolun kat edilmesi mümkün müdür? Bu yakın zamanda yaygın olarak uygulanabilir bir teknoloji haline gelir mi?

-Kendi kendini kullanan otomobiller üzerinde çok çalışılan bir konu, en çok on yıl içinde gerçekleşeceğini tahmin ediyorum. Kendisi park eden otomobiller zaten var. Böylece hem insanlar yolculuk ederken daha rahat edecek, hem de toplam randıman artabilecek. Otomobil şoförü izleyerek öğrenebilir tabii; hangi durumlarda şoförün ne yaptığı kaydedilip bundan kurallar çıkarılabilir, ama zaten bunun her araba için ayrıca yapılması gerekmez. Böyle bir elektronik şoförün tepki zamanı insana göre çok daha kısa olacaktır. Böylesi otomobiller, bir merkezle ya da birbirleriyle iletişim kurup kendi aralarında sıralama, birbirlerine yol verme vs gibi eylemleri insan sürücülere göre çok daha kolay, hızlı ve eşitliği koruyarak yapabilir. Örneğin yollardaki sıkışıklığın en büyük nedeni şerit değiştirmelerin doğru yapılmamasıdır. İstanbul?u düşünün, iki kıta arasında iki köprü var ve toplam 6 şerit gidiş, 6 şerit dönüş var. O şeritleri besleyen trafiğin düzenlileştirilmesiyle, örneğin otoyol üzerinde tren gibi aynı ve yüksek hızda, az aralıkla birbirini izleyen otomobil dizileri oluşturulmasıyla ancak bu kapasite artırılabilir. Bu konuda da araştırmalar var.

Burada en zor iş, yola bir tane insan şoförlü araç çıktığında ne yapılacağı olacak

Kitabın Künyesi
Yapay Öğrenme
Orjinal isim: Introduction to Machine Learning
Ethem Alpaydın
Boğaziçi Üniversitesi Yayınevi / Temel Bilim – Mühendislik Dizisi
Nisan 2011, 1. Basım
486 sayfa

Yapay Öğrenme – Ethem Alpaydın

Bir yanıt yazın