R Üzerinde Tesadüfi Orman Kullanarak Araba Değerlendirmesi Yapmak

Evet R ve Python üzerinde geçişler yaparak makine öğrenimi algoritmalarını uygulamaya devam ediyoruz. Son yazıyı Python üzerinde yazdıktan sonra bu yazıda da R üzerinde devam edeceğiz. Makine öğreniminin en güzide algoritmalarından biri olan tesadüfi(rastgele) orman (random forest) metodu ile arabaların bir değerlendirmesini yapacak ve seviyelerini sınıflandıracağız. Veri setini tanımlayarak başlayalım. Veri seti, arabaların belli başlı […]

Python Üzerinde Destek Vektör Makineleri Kullanarak Şarap Kalitesi Belirleme

Bu yazıda, sınıflandırma(classification) problemlerinde çok kullanılan ve en iyi yöntemler arasında sayılan bir makine öğrenmesi modelini Python üzerinde uygulayacağız. Bahsettiğimiz model sizin de muhtemelen aşina olduğunuz Destek Vektör Makineleri(Support Vector Machines) olacak. Bu modeli kullanarak kırmızı ve beyaz şarapların kalite sınıflandırmasını yapacağız. Bu kez konu da geçmiş konulara göre hayli ilginç olacak. Buna ek olarak, […]

R Üzerinde Güçlendirilmiş Karar Ağacı: İnşaat Ruhsatları Üzerine Bir Çalışma

Bir önceki yazımda güçlendirilmiş karar ağacı yöntemiyle bir gelir tahminleme modeli kurmuştum ve bir sonraki yazının da R üzerinde olacağını söylemiştim. Bu yazıda da aynı yöntemi R üzerinde uygulayacağız fakat bu kez farklı bir veri seti ve farklı bir güçlendirme(boosting) algoritması kullanacağız. Bunların ne olduğuna yazı ilerledikçe değineceğim. Bir önceki yazıda boosting metodunun ne olduğundan, […]

Python Üzerinde Güçlendirilmiş Karar Ağacı: Gelir Tahminleme

Bu yazıda, bir önceki yazıda olduğu gibi yine bir classification(sınıflandırma) işlemi gerçekleştireceğim. Fakat bu kez lojistik regresyon değil, bir başka sınıflandırma metodu olan karar ağaçlarını kullanacağım. Bunu yaparken de doğru tahminleme oranını artırmak adına çok kullanılan ve etkinliği kanıtlanmış bir yöntem olan güçlendirme(boosting) yöntemini kullanacağım. Karar ağaçlarının ve boosting yönteminin teorik detaylarına yeri geldikçe değineceğiz. […]

Python Üzerinde Lojistik Regresyon: Bankacılık Müşterisi Tahminleme

Lojistik regresyon, istatistikte ve makine öğrenmesinde çokça kullanılan sınıflandırma(classification) yöntemlerinden biridir. Şu ana kadarki yazılarımda daha çok regresyon yönteminin üzerine düşmüştüm. Bu yazıda ise her ne kadar kullanacağımız metodun adı regresyon da olsa, önceki regresyon yazılarından farklı olarak nümerik bir çıktıyı(output) değil, bir sınıfı(kategoriyi) tahmin etmeye çalışacağım. Bu tarz tahminler yapan yöntemlere sınıflandırma(classification) yöntemleri denir. […]

Python Üzerinde Ridge Regresyon: İşsizlik Oranı Tahminleme

Regresyon ile alakalı daha önceki yazılarda belirli değişkenler üzerinden modeli kurma ve performansını ölçme, birkaç model arasından en iyi performans vereni seçme gibi konulardan bahsetmiştim. Bu yazıda ise farklı bir regresyon çeşidi olan “Ridge” regresyondan bahsedeceğim. Ridge regresyonun konsepti, özellikleri ve neden kullanıldığına dair teorik bilgileri yazının ilgili bölümünde anlatacağım. Fakat şimdi yazının işleyiş sürecinin […]

R Üzerinde Çoklu Doğrusal Regresyon – Bölüm 1: Film Skorlarını Tahminleme

Doğrusal regresyon, aralarında doğrusal ilişki bulunan değişkenlerin arasındaki bu ilişkiyi incelemekte ve bunu kullanarak tahmin yapmakta kullanılır. Bu yazıda, doğrusal regresyonun detaylarına ve kullanımına değinerek, model kurma ve seçmeyi anlatacağım. Doğrusal regresyon, adından da anlaşılabileceği gibi değişkenler arasındaki ilişkiden yola çıkarak bir lineer model kurar ve bu model vasıtasıyla da bağımlı değişkenin gelecekteki değerini tahmin […]