Makine Öğrenmesine Kısa Bir Bakış

Makine öğreniminin mevcut kullanımları iki bakış açısının birleşiminden gelmektedir. Bunlar istatistikçilerin bakış açısı ve bilgisayar bilimcilerinin bakış açısıdır. Üçüncü bir bakış açısı model geliştirilirken ve eğitilirken bağlamı ortaya çıkaran sektörel bakıştır.

İstatiksel Bakış Açısı

İstatistikçilerin bakış açısı verileri anlamaktan evrimleşmiştir. Veri analizi alanı, başlangıçta "Süreçleri matematiksel anlamda nasıl daha iyi anlarız?" gibi benzer sorulara dayanan bir alandı. Bu sorulardan çevremizdeki dünyayı modellemek için olasılık tabanlı modeller kullanıldı. Örneğin, bir sınıfın test puanlarını, bir makinenin hatalı çıkardığı ürün sayısını, bir otobandaki günlük kaza sayısını veya bir metindeki kelimelerin ne sıklıkla göründüğünü modellemek için bir dağılım vardır. Süreçlerin istatistiksel anlamda takip edilmesi ve bunun gibi dağılımların türetilmesi gerçek dünyada veri oluşturabilecek mekanizmalar için önemli atılımlardı.

Bu matematiksel işlevler günlük hayatımızın esasen tüm yönlerini tanımlamak için kullanıldı. Ancak ortaya çıktığı gibi istatiksel modeller gerçek dünyada var olan karmaşıklıkların aşırı basitleştirilmesidir. Bir olaya dair örneklem alınarak oluşturulan olasılığa dayalı modeller, dünyada gözlemlenen gerçek verileri simüle etme konusunda çoğu zaman büyük resmi ortaya koyup fikir verirken; olayı tam anlamıyla anlamada yüksek oranlarda başarılı değildir.

Bilgisayar Bilimcilerin Bakış Açısı

1950’lerde bilgisayar bilimciler, bir bilgisayarın alacağı her kararı temelde hiç bitmeyen if-else ifadeleri olarak kodlamanın yerine bilgisayarın verilere bakarak neyin en iyi olduğunu belirlemesi ve kalıpları (örüntüleri) tanıması gerektiğini fark ettiler. Bu kalıpları tanıma fikri, yaygın olarak makine öğrenimi olarak kabul edilen şeydir. Sabit kodlama kurallarından kaçınmak için istatistik dünyasından alınan bu yeni teknikler, dağılımlara dayalı kuralları içeriyordu. Ancak istatistiksel dağılımları veri oluşturucu olarak kullanmak, modellerimiz tarafından oluşturulan verilerle gerçekten elde ettiğimiz veriler arasında oldukça büyük farklılıklar ortaya çıkardı.

Artan işlemci gücüyle birlikte makine öğrenimi giderek daha fazla veriye ve giderek daha az insan tarafından uygulanan if-else ifadelerine dayanan son derece esnek modellere dönüşmeye devam etti. Bu esnek modellerin önceki iyi tanımlanmış modelleme tekniklerinden daha iyi tahminde bulunduğu anlaşılmıştır. Tahmin genellikle son derece esnek ve karmaşık modeller yaratarak anahtar hale gelmiş ve günümüzdeki makine öğrenimine evrilmiştir. Bu karmaşık modeller insanlar tarafından oluşturulan if-else ifadelerine dayanan algoritmaların yanı sıra iyi bilinen olasılık dağılımlarına dayanan modellerden de daha iyi performans gösterir. Ne yazık ki bu karmaşık modeller genellikle bir tahminin nedenini bilmeden bırakır. Bu teknikler tümörleri doktorlardan daha iyi tanımlayabilir veya go oyununda profesyonelleri yenebilir. Bu kadar yüksek oranlarda tahmin doğruluğu olsa da bu modelleri yaratan kişiler bilgisayarın bu kararları neden aldıklarını her zaman açıklayamazlar.

Makine Öğrenme Tipleri

Makine öğrenmesi 3 ana kategoriye ayrılır.

Denetimli Öğrenme ( Supervised Learning )
- Sınıflandırma(Classification)
- Regresyon
Denetimsiz Öğrenme ( Unsupervised Learning )
Pekiştirmeli Öğrenme ( Reinforcement Learning )

Denetimli Öğrenme ( Supervised Learning )

Denetimli öğrenmede algoritmalarımız etiketli verilerden öğrenir. Etiketlenmiş verileri inceledikten sonra bu teknikler kalıpları gözlemleyerek ve bu kalıpları yeni etiketlenmemiş verilerle ilişkilendirilerek yeni verilere hangi etiketin verilmesi gerektiğini belirleyebilir.

Denetimli öğrenme iki kategoriye ayrılabilir: sınıflandırma ve regresyon.

Sınıflandırma modelleri bir öğenin ait olduğu kategoriyi tahmin eder. Birçok kişi bu modellerin bir epostanın spam olup olmadığı gibi yalnızca iki olası sonlu olaylar için kullanıldığını zannetmektedir ancak çoğu aslında bir çok sonuçlu kategorileri tahmin edebilir. Örneğin bir köpeğin birçok ırktan hangisine ait olduğunu tahmin etmemimizi sağlayan sınıflandırma teknikleri vardır.

Alternatif olarak, regresyon modelleri hem evet ya da hayır gibi iki olası sonuçlu durumları tahmin ederken hem de ev fiyatı, olası senelik gelir veya bireyin boyu gibi sayısal bir değeri tahmin eder.

Denetimsiz Öğrenme ( Unsupervised Learning )

Denetimli öğrenme, bilgisayara bir dizi eğitim verisinin verildiği ve bilgisayarın bu verilere dayanarak sonuçları nasıl tahmin edeceğini öğrendiği bir süreçtir. Denetimsiz öğrenme ise bilgisayara verilerin verildiği ancak onunla ne yapacağının söylenmediği, verilerin tahmin edilmesi için nasıl gruplandırılacağına veya kümelendireceğine bilgisayarın karar vereceği bir süreçtir.

Denetimsiz öğrenme üzerinde çalışılacak etiketler olmadığında veriler için modeller oluşturur. Yani bir anlamda bu model oluşturma işini denetimsiz olarak yapabilir. Bu tekniklerin uygulamaları bir veri kümesini daha az sayıda faydalı özelliğe indirgemekten benzer öğeleri gruplandırmaya, pazar segmentlerini bulmaktan müzik tavsiye sistemleri oluşturmaya kadar oldukça geniştir.

Pekiştirmeli Öğrenme ( Reinforcement Learning )

Pekiştirmeli öğrenme belirli eylemleri gerçekleştirmeye ve bu eylemler için ödüller almaya dayalı olarak öğrenen algoritmaları eğitmek için kullanılan takviyeli öğrenme olarak bilinir. Pekiştirmeli öğrenme uygulamalarına kendi kendini süren arabalar, go oyununda uzmanları yenen uygulamalar veya oyun botları örnek olarak gösterilebilir.

Derin Öğrenme ve Nöral Ağlar

Yapay zeka ve makine öğrenimi ile ilgili içerikleri takip ediyorsanız muhtemelen derin öğrenmeyi duymuşsunuzdur. Derin öğrenme tahmin etme yeteneğinde esasen diğer tüm makine öğrenimi algoritmalarını geride bıraktı ve aslında denetimli, denetimsiz ve pekiştirmeli öğrenmelerin hepsi için kullanılabilir.

Tarihsel bir perspektifle bakıldığında bu tekniğin büyümesi çok anlamlıdır. Zamanla tahminleri nasıl yaptığımızla giderek daha az ilgilendik ve şimdi tahminlerimizin doğruluğuna daha çok önem veriyoruz. Derin öğrenmede doğruluk çok yüksek olsa da modelimizin nasıl veya neden belirli tahminlerde bulunduğunu nadiren anlarız.

Ne yazık ki derin öğrenme her sorunun çözümü değildir. Giriş için 3 ana engeli vardır.

Yeterli veriye sahip olmanız gerekir. Derin öğrenme çok fazla veri gerektirir.
Yüksek Bilgi işlem gücüne sahip olmalısınız . Go oyununda başarılı olmak için GOOGLE’ın DeepMind AlphaGo’su 1.202 CPU ve 176 GPU gerektiriyordu.
Bu algoritmaların karmaşıklığı ve esnekliği göz önüne alındığında belirli kararların neden alındığını muhtemelen anlamayacaksınız.

Bu nedenlerden dolayı her makine öğrenimi uygulaması derin öğrenme gerektiren bir süreç değildir.

TensorFlow ve Scikit-learn

Makine öğrenimi problemleri ile ilgileniyorsanız, bu sorunları çözmek için dünyadaki en popüler açık kaynak kitaplıklarından ikisi TensorFlow ve Scikit-learn'dir.

TensorFlow ve Scikit-learn, veri bilimcilerine denetimli ve denetimsiz makine öğreniminde en gelişmiş teknikleri farklı durumlar için kolayca kullanma becerisi sağlar. TensorFlow ve Scikit-learn'in öngörülebilir gelecekte hem endüstri de hem de akademi de makine öğrenimi için popüler olacağını söyleyebilir.

Makine Öğrenmesinde Etik

Makine öğrenimi modelleri verileri verimli ve akıllı bir şekilde özetleme gücüne sahiptir. Ne yazık ki dünyamızdaki veriler genellikle hatalar ve önyargılar içerdiğinden oluşturduğumuz modeller aynı hatalar ve önyargıları içerecektir. Örnek olarak mevcut verilere dayanarak bir iş için en iyi adayın kim olduğunu tahmin etmek için bir model oluşturmak isteyelim. Cinsiyete, ırka, yaşa, ekonomik duruma vb. dayalı önyargılar ve geçmiş işe alım modelleri varsa bu önyargılar bu verilere dayanarak oluşturduğunuz herhangi bir tahmine dayalı modelde de olacaktır. Ne yazık ki insana ait olan önyargı, insanlar verilerin yaratıcıları olduğu sürece bilgisayarlara da aktarılacaktır. Görüntüler, metinler, konuşmalar ve videoların tümü günümüz dünyasında veri tabanlı kararlar almak için bilgisayarlar tarafından alınan verilerdir. Ama bu verileri insanlar üretir. Modellerimizi oluştururken insani önyargılarımızın bir sonucu olarak oluşturulan verilerdeki olası önyargılar her zaman aklımızda olmalıdır. Modellerin gerçek dünya doğrulaması istatistiksel doğrulamadan bile daha önemlidir.

volkanköse

"veritas, probitas, scienta"

Makine Öğrenmesine Kısa Bir Bakış

Son Yazılar

Comentarios