R Üzerinde Tesadüfi Orman Kullanarak Araba Değerlendirmesi Yapmak

Evet R ve Python üzerinde geçişler yaparak makine öğrenimi algoritmalarını uygulamaya devam ediyoruz. Son yazıyı Python üzerinde yazdıktan sonra bu yazıda da R üzerinde devam edeceğiz. Makine öğreniminin en güzide algoritmalarından biri olan tesadüfi(rastgele) orman (random forest) metodu ile arabaların bir değerlendirmesini yapacak ve seviyelerini sınıflandıracağız. Veri setini tanımlayarak başlayalım. Veri seti, arabaların belli başlı […]

Python Üzerinde Destek Vektör Makineleri Kullanarak Şarap Kalitesi Belirleme

Bu yazıda, sınıflandırma(classification) problemlerinde çok kullanılan ve en iyi yöntemler arasında sayılan bir makine öğrenmesi modelini Python üzerinde uygulayacağız. Bahsettiğimiz model sizin de muhtemelen aşina olduğunuz Destek Vektör Makineleri(Support Vector Machines) olacak. Bu modeli kullanarak kırmızı ve beyaz şarapların kalite sınıflandırmasını yapacağız. Bu kez konu da geçmiş konulara göre hayli ilginç olacak. Buna ek olarak, […]

R Üzerinde Güçlendirilmiş Karar Ağacı: İnşaat Ruhsatları Üzerine Bir Çalışma

Bir önceki yazımda güçlendirilmiş karar ağacı yöntemiyle bir gelir tahminleme modeli kurmuştum ve bir sonraki yazının da R üzerinde olacağını söylemiştim. Bu yazıda da aynı yöntemi R üzerinde uygulayacağız fakat bu kez farklı bir veri seti ve farklı bir güçlendirme(boosting) algoritması kullanacağız. Bunların ne olduğuna yazı ilerledikçe değineceğim. Bir önceki yazıda boosting metodunun ne olduğundan, […]

Python Üzerinde Güçlendirilmiş Karar Ağacı: Gelir Tahminleme

Bu yazıda, bir önceki yazıda olduğu gibi yine bir classification(sınıflandırma) işlemi gerçekleştireceğim. Fakat bu kez lojistik regresyon değil, bir başka sınıflandırma metodu olan karar ağaçlarını kullanacağım. Bunu yaparken de doğru tahminleme oranını artırmak adına çok kullanılan ve etkinliği kanıtlanmış bir yöntem olan güçlendirme(boosting) yöntemini kullanacağım. Karar ağaçlarının ve boosting yönteminin teorik detaylarına yeri geldikçe değineceğiz. […]

Python Üzerinde Lojistik Regresyon: Bankacılık Müşterisi Tahminleme

Lojistik regresyon, istatistikte ve makine öğrenmesinde çokça kullanılan sınıflandırma(classification) yöntemlerinden biridir. Şu ana kadarki yazılarımda daha çok regresyon yönteminin üzerine düşmüştüm. Bu yazıda ise her ne kadar kullanacağımız metodun adı regresyon da olsa, önceki regresyon yazılarından farklı olarak nümerik bir çıktıyı(output) değil, bir sınıfı(kategoriyi) tahmin etmeye çalışacağım. Bu tarz tahminler yapan yöntemlere sınıflandırma(classification) yöntemleri denir. […]

Python Üzerinde Ridge Regresyon: İşsizlik Oranı Tahminleme

Regresyon ile alakalı daha önceki yazılarda belirli değişkenler üzerinden modeli kurma ve performansını ölçme, birkaç model arasından en iyi performans vereni seçme gibi konulardan bahsetmiştim. Bu yazıda ise farklı bir regresyon çeşidi olan “Ridge” regresyondan bahsedeceğim. Ridge regresyonun konsepti, özellikleri ve neden kullanıldığına dair teorik bilgileri yazının ilgili bölümünde anlatacağım. Fakat şimdi yazının işleyiş sürecinin […]

R Üzerinde Çoklu Doğrusal Regresyon – Bölüm 1: Film Skorlarını Tahminleme

Doğrusal regresyon, aralarında doğrusal ilişki bulunan değişkenlerin arasındaki bu ilişkiyi incelemekte ve bunu kullanarak tahmin yapmakta kullanılır. Bu yazıda, doğrusal regresyonun detaylarına ve kullanımına değinerek, model kurma ve seçmeyi anlatacağım. Doğrusal regresyon, adından da anlaşılabileceği gibi değişkenler arasındaki ilişkiden yola çıkarak bir lineer model kurar ve bu model vasıtasıyla da bağımlı değişkenin gelecekteki değerini tahmin […]

R Üzerinde Varyans Analizi(ANOVA): Eğitim Düzeyi ve TV İzleme İlişkisi

  ANOVA(Analysis of Variance), kategorik bir değişkeni bağımsız olarak ve nümerik bir değişkeni de bağımlı değişken olarak alır. Yani, kategorik değişkenin seviyeleri(kategorileri) değiştikçe nümerik değişken de anlamlı olarak değişiyor mu bunu araştırır. Biraz daha açacak olursak, bir örneklemin ortalamasından istatistiksel bir çıkarım yapmak istediğimizde veya aynı işlemi 2 gruba uygulamak istediğimizde, t testini kullanırız. Fakat […]

R Üzerinde Ki-Kare Bağımsızlık Testi: Ekonomik Sınıf ve Eğitim Düzeyi İlişkisi

  R’ın istatistiksel analizler konusundaki gücünden bahsetmiştik. Şimdi bunu pekiştirmek adına bu yazıda R kullanarak ki-kare bağımsızlık testi gerçekleştirmeyi ve iki değişken arasındaki ilişkinin varlığını test etmeyi anlatacağım. İki değişkenin birbirinden bağımsız olması demek, ikisi arasında ilişki olmaması ve birbirlerinin sonuçlarını etkilememeleri demektir. Tam tersi bağımlı olmaları ise, birinin sonucunun diğerini etkileyeceğini gösterir. Ki-kare bağımsızlık […]

R Kodları Kullanarak Power BI Üzerine Veri Yüklemek ve Görselleştirmek

  R programlama dili kullanarak ham veriye şekil verme, düzenleme ve analiz etmenin ne kadar etkin olduğu, veri sektörüyle az da olsa alakası olan herkes tarafından bilinmektedir. Bu yazıda, son birkaç yılda özellikle veri bilimi alanında yükselişi süren istatistiksel programlama dili R’ın, Microsoft’un raporlama aracı olan Power BI ile entegrasyonundan bahsedeceğim. Başlamadan önce yazının nasıl […]