Python Üzerinde Güçlendirilmiş Karar Ağacı: Gelir Tahminleme

Bu yazıda, bir önceki yazıda olduğu gibi yine bir classification(sınıflandırma) işlemi gerçekleştireceğim. Fakat bu kez lojistik regresyon değil, bir başka sınıflandırma metodu olan karar ağaçlarını kullanacağım. Bunu yaparken de doğru tahminleme oranını artırmak adına çok kullanılan ve etkinliği kanıtlanmış bir yöntem olan güçlendirme(boosting) yöntemini kullanacağım. Karar ağaçlarının ve boosting yönteminin teorik detaylarına yeri geldikçe değineceğiz. […]

Python Üzerinde Lojistik Regresyon: Bankacılık Müşterisi Tahminleme

Lojistik regresyon, istatistikte ve makine öğrenmesinde çokça kullanılan sınıflandırma(classification) yöntemlerinden biridir. Şu ana kadarki yazılarımda daha çok regresyon yönteminin üzerine düşmüştüm. Bu yazıda ise her ne kadar kullanacağımız metodun adı regresyon da olsa, önceki regresyon yazılarından farklı olarak nümerik bir çıktıyı(output) değil, bir sınıfı(kategoriyi) tahmin etmeye çalışacağım. Bu tarz tahminler yapan yöntemlere sınıflandırma(classification) yöntemleri denir. […]

Python Üzerinde Ridge Regresyon: İşsizlik Oranı Tahminleme

Regresyon ile alakalı daha önceki yazılarda belirli değişkenler üzerinden modeli kurma ve performansını ölçme, birkaç model arasından en iyi performans vereni seçme gibi konulardan bahsetmiştim. Bu yazıda ise farklı bir regresyon çeşidi olan “Ridge” regresyondan bahsedeceğim. Ridge regresyonun konsepti, özellikleri ve neden kullanıldığına dair teorik bilgileri yazının ilgili bölümünde anlatacağım. Fakat şimdi yazının işleyiş sürecinin […]

R Üzerinde Çoklu Regresyon Bölüm 2: Ev Fiyatlarını Tahminleme

Regresyon ile alakalı ilk yazımda, çoklu doğrusal regresyon kullanarak film skorlarını tahminlemiştim. Bu yazıda ise yine çoklu regresyon kullanarak ev fiyatlarını tahminleyeceğim. Yazı boyunca nasıl bir yol izleyeceğimi anlatayım. Öncelikle, bir önceki yazı kadar regresyona dair temel bilgiler aktarmayacağım. Daha çok uygulama ağırlıklı bir yazı olacak ve teorik bilgileri biraz daha azaltmaya çalışacağım. Veri setini […]

R Üzerinde Çoklu Doğrusal Regresyon – Bölüm 1: Film Skorlarını Tahminleme

Doğrusal regresyon, aralarında doğrusal ilişki bulunan değişkenlerin arasındaki bu ilişkiyi incelemekte ve bunu kullanarak tahmin yapmakta kullanılır. Bu yazıda, doğrusal regresyonun detaylarına ve kullanımına değinerek, model kurma ve seçmeyi anlatacağım. Doğrusal regresyon, adından da anlaşılabileceği gibi değişkenler arasındaki ilişkiden yola çıkarak bir lineer model kurar ve bu model vasıtasıyla da bağımlı değişkenin gelecekteki değerini tahmin […]

R Üzerinde Varyans Analizi(ANOVA): Eğitim Düzeyi ve TV İzleme İlişkisi

  ANOVA(Analysis of Variance), kategorik bir değişkeni bağımsız olarak ve nümerik bir değişkeni de bağımlı değişken olarak alır. Yani, kategorik değişkenin seviyeleri(kategorileri) değiştikçe nümerik değişken de anlamlı olarak değişiyor mu bunu araştırır. Biraz daha açacak olursak, bir örneklemin ortalamasından istatistiksel bir çıkarım yapmak istediğimizde veya aynı işlemi 2 gruba uygulamak istediğimizde, t testini kullanırız. Fakat […]

R Üzerinde Ki-Kare Bağımsızlık Testi: Ekonomik Sınıf ve Eğitim Düzeyi İlişkisi

  R’ın istatistiksel analizler konusundaki gücünden bahsetmiştik. Şimdi bunu pekiştirmek adına bu yazıda R kullanarak ki-kare bağımsızlık testi gerçekleştirmeyi ve iki değişken arasındaki ilişkinin varlığını test etmeyi anlatacağım. İki değişkenin birbirinden bağımsız olması demek, ikisi arasında ilişki olmaması ve birbirlerinin sonuçlarını etkilememeleri demektir. Tam tersi bağımlı olmaları ise, birinin sonucunun diğerini etkileyeceğini gösterir. Ki-kare bağımsızlık […]