Makine Öğrenmesine Giriş

0
1566

Makine öğrenmesi nedir? Makine öğrenmesine neden ihtiyaç duyarız?

Bilgisayarların örnek verileri veya deneyimleri kullanarak belli şartlara göre başarılı sonuçlar verecek şekilde programlanmasına makine öğrenmesi(machine learning) diyoruz.

İnsan beyninin ilk bakışta göremediği büyük hacimli veri kümeleri ( big data) arasındaki ilişkileri belirli algoritmalar yardımıyla analiz ederek ve öğrenerek ortaya çıkarması için öğrenen makinelere ihtiyaç duyarız.

Avantajları ve Yetenekleri

  • Uzmanların yetersiz olduğu noktalarda karar organlarına yardımcı olabilir.
  • Sürekli çalışır halde ve hızlıdırlar.
  • Yeni eğitim verileriyle kendini güncelleyebilir.
  • Daha önce karşılaşmadığı durumlar icin sonuç üretebilirler.Modeli değiştirebilirler.
  • Karmaşık veriler arasındaki ilişkileri bulabilir veya iç içe geçmiş verileri kümeleyebilir.
  • İstatiksel sonuçlar dışında öngörülemeyen sonuçlar bulurlar.
  • Matematiksel veya başka yöntemlerle modellenemeyen yöntemleri istatistik kullanarak inceleme ve çözümleme yoluyla modelleyebilirler.
  • Görüntü, ses vb. verilerle çalışabilir ( plaka tanıma, duygu analizi vb.)

Eksik veya Zayıf yönleri

  • Modeller sonuçlar üretse de kesinlik yoktur. Tahmin vardır. Bu yüzden sonuçların değerlendirilmesi işleme alınıp alınmaması veya model güncellenmesi icin insana ihtiyaç vardır.
  • Veri miktarı çok olsa da ortaya bir model çıkmayabilir. Yanlış eğitim verileri hatalı öğrenmeye neden olabilir.
  • Modeli kurulan durumun değişmesi halinde tekrar eğitime ihtiyaç duyar.
  • Çok büyük verilerle çalısması gerektiğinde işlemci,ram,hard disk vb. donanım yetersizliği sorunu yaşanabilir.
  • Bazı yapay zeka teknikleri eksik verilerle çalışabilirken (yapay sinir ağları), bazıları bunu yapamayabilir.
  • Performansı optimum seviyede olan modeli elde etmek için çok sayıda algoritma, işlemsel süreç denemek gerekebilir.

makine öğrenmesi

Makine öğrenmesi işlem süreci :

  1. Veri koleksiyonu oluşturma
  2. Veri temizleme ve düzenleme
  3. Makine öğrenmesi araçlarının kullanımı
  4. Sonuçların değerlendirilmesi

1.Veri koleksiyonu oluşturma

Bu konu veri madenciliği biliminin kapsamına girer. Veriler dijital bir dosya olabileceği gibi ( .csv( virgülle ayrılmış değerler) .txt .xsl .raw vb. ), fiziksel ortamlarda da bulunabilir.

Dijital veri depolama ortamlarındaki kapasite artışı veri üreten, saklayan yazılım ve donanımların sayısındaki artış elektronik aygıtların maliyetlerindeki düşüş ve buna bağlı olarak yaygınlaşması büyük veriyi ( big data) ortaya çıkarmıştır.

Büyük verinin işlenerek kullanılabilir haldeki veri koleksiyonuna dönüştürülmesi veri madenciliği biliminin konusudur.

2.Veri temizleme ve düzenleme

Bu aşama da veri madenciliği disiplini ile ilgilidir.Verilerdeki tutarsızlıklar, hatalar vb. ortaya çıkacak makine öğrenmesi sonucunu olumsuz etkileyen her türlü durumun giderilmesi bu aşamada gerçekleştirilir. Bu işlemler günümüzde insan kontrollü yapıldığı gibi yazılımlar aracılığıyla da yapılmaktadır.

3.Makine öğrenmesi araçlarının kullanımı

Makine öğrenmesi bilimi istatistik, matematik,bilgisayar mühendisliği bilimleriyle derin bir işbirliği içerisindedir. Bu bilim dallarının sahip olduğu yetenekler bir araya getirilerek veri koleksiyonları içerisindeki kuralları araştıran fonksiyon elde etmeyi amaçlayan kısacası uzmanların sahip olduğu değerlendirme ve karar verme yeteneklerini ortaya çıkaran her türlü yazılım araçlarıdır.

4.Sonuçların değerlendirilmesi

Bu aşamada ortaya çıkan makine öğrenmesi temelli modelin istenilen başarıyı verip vermediği kullanılabilirliği gerçek dünyaya uygulanabilirliği vb. yeterlilikleri değerlendirilir ve tartışılır. Makine öğrenmesi modelinin değerlendirilmesinde istatiksel veriler temel alınır. Bu sonuçlara göre sistemin eğitimine devam edilebilir( yeni veriler eklenerek ) veya önceki adımlara geri dönülebilir, eğitimine devam edilir.

CEVAP VER

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.