R Üzerinde Çoklu Regresyon Bölüm 2: Ev Fiyatlarını Tahminleme

Regresyon ile alakalı ilk yazımda, çoklu doğrusal regresyon kullanarak film skorlarını tahminlemiştim. Bu yazıda ise yine çoklu regresyon kullanarak ev fiyatlarını tahminleyeceğim. Yazı boyunca nasıl bir yol izleyeceğimi anlatayım. Öncelikle, bir önceki yazı kadar regresyona dair temel bilgiler aktarmayacağım. Daha çok uygulama ağırlıklı bir yazı olacak ve teorik bilgileri biraz daha azaltmaya çalışacağım. Veri setini […]

R Üzerinde Çoklu Doğrusal Regresyon – Bölüm 1: Film Skorlarını Tahminleme

Doğrusal regresyon, aralarında doğrusal ilişki bulunan değişkenlerin arasındaki bu ilişkiyi incelemekte ve bunu kullanarak tahmin yapmakta kullanılır. Bu yazıda, doğrusal regresyonun detaylarına ve kullanımına değinerek, model kurma ve seçmeyi anlatacağım. Doğrusal regresyon, adından da anlaşılabileceği gibi değişkenler arasındaki ilişkiden yola çıkarak bir lineer model kurar ve bu model vasıtasıyla da bağımlı değişkenin gelecekteki değerini tahmin […]

R Üzerinde Varyans Analizi(ANOVA): Eğitim Düzeyi ve TV İzleme İlişkisi

  ANOVA(Analysis of Variance), kategorik bir değişkeni bağımsız olarak ve nümerik bir değişkeni de bağımlı değişken olarak alır. Yani, kategorik değişkenin seviyeleri(kategorileri) değiştikçe nümerik değişken de anlamlı olarak değişiyor mu bunu araştırır. Biraz daha açacak olursak, bir örneklemin ortalamasından istatistiksel bir çıkarım yapmak istediğimizde veya aynı işlemi 2 gruba uygulamak istediğimizde, t testini kullanırız. Fakat […]

R Üzerinde Ki-Kare Bağımsızlık Testi: Ekonomik Sınıf ve Eğitim Düzeyi İlişkisi

  R’ın istatistiksel analizler konusundaki gücünden bahsetmiştik. Şimdi bunu pekiştirmek adına bu yazıda R kullanarak ki-kare bağımsızlık testi gerçekleştirmeyi ve iki değişken arasındaki ilişkinin varlığını test etmeyi anlatacağım. İki değişkenin birbirinden bağımsız olması demek, ikisi arasında ilişki olmaması ve birbirlerinin sonuçlarını etkilememeleri demektir. Tam tersi bağımlı olmaları ise, birinin sonucunun diğerini etkileyeceğini gösterir. Ki-kare bağımsızlık […]

R Kodları Kullanarak Power BI Üzerine Veri Yüklemek ve Görselleştirmek

  R programlama dili kullanarak ham veriye şekil verme, düzenleme ve analiz etmenin ne kadar etkin olduğu, veri sektörüyle az da olsa alakası olan herkes tarafından bilinmektedir. Bu yazıda, son birkaç yılda özellikle veri bilimi alanında yükselişi süren istatistiksel programlama dili R’ın, Microsoft’un raporlama aracı olan Power BI ile entegrasyonundan bahsedeceğim. Başlamadan önce yazının nasıl […]

Cache Transform Kullanarak RAM Optimizasyonu Yapmak

  SSIS’te Lookup yapılırken cache mode seçeneklerinin çalışma performansını nasıl etkilediğinden bahsetmiştik. Özellikle Full Cache mod kullanıldığında, data flow başlamadan tüm referans tablosunun RAM’e alındığını ve eşleşme aramalarının RAM üzerinde yapıldığını biliyoruz. Bu da doğal olarak sorgulama yapmak için veritabanına gidilmesi gereğini ortadan kaldırarak Lookup işleminin hızlı bir biçimde tamamlanmasını sağlar. Fakat bu hızın da […]

SSIS Üzerinde Range Lookup İşlemi

İş zekası araçlarındaki “Lookup” komponentinin ne işe yaradığını az çok hepimiz biliyoruzdur. SQL’deki join işlemine yakın bir işlem gerçekleştirir. Eğer lookup hakkında pek bilgi sahibi değilseniz, bu konuda araştırma yapmanızı tavsiye ederim. Diğerlerinde olduğu gibi SSIS’te de Lookup komponenti aslında bir önceki yazımızda da bahsettiğimiz gibi Merge Join’in yaptığı işe benzer bir işlem yapar. Arada […]

SSIS Üzerinde Merge Join Kullanarak Veri Setini Genişletmek

  SSIS(SQL Server Integration Services)’teki Merge Join komponenti, elimizdeki veri setini genişletmek için kullanışlı bir araçtır. Veri setini genişletmek derken ne demek istediğimizi anlatayım önce. İlişkisel veri tabanı sistemlerindeki “Foreign Key” mantığını az çok hepimiz biliyoruzdur. Bir tabloda “Foreign Key” özelliğini taşıyan kolon, aslında simgesel bir değerdir. Ne demek simgesel? Yani başka bir tabloda o […]