Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

İleri İstatistik Teknikleri

Benzer bir sunumlar


... konulu sunumlar: "İleri İstatistik Teknikleri"— Sunum transkripti:

1 İleri İstatistik Teknikleri
Üç tür yalan vardır: Yalan, Kuyruklu Yalan, İstatistik Benjamin Disraeli Dördüncü tür yalan İleri İstatistiktir, Emre Yeterince döndürürseniz veriye her türlü bulguyu itiraf ettirtebilirsiniz.... Anonim “Hayat fena halde futbola benzer: dört doğru pas yüzde 90 gol demektir” Bir filmden

2 İleri İstatistik Teknikleri
? Neden “ileri” teknikler? Amaç: Eldeki “veriyi” “bilgiye” dönüştürebilmek - Veri vs. Bilgi

3 İstatistiksel Yöntemler
Betimleyici (Descriptive) Yöntemler Verili herhangi bir dağılımı bir ya da birden çok katsayıda anlatabilmek - Örn: şirkettekilerin yaş ortalaması Açıklayıcı (Explanatory) Yöntemler Bir veri setinde olası ilişkileri sergilemek - Örn: Şirkettekilerin ayakkabı numaralarıyla aldıkları maaş arasındaki ilişki

4 Betimleyici Yöntemler
Amaç: Eldeki dağılımı en iyi şekilde temsil etmek Araçlar: Ortalama: Medyan: Mod:

5 Betimleyici Yöntemler
Veeee.... Varyans/Standart Sapma: Neden:

6 İki Dağılımın Hikayesi
6,6,6 Ortalama: 6 Medyan: 6 Mod: 6 Std. Sapma: 0 Dağılım: 0,6,12 Ortalama: 6 Medyan: 6 Mod: 6 Std: Sapma: 6 Amaç: Görünenin Ötesine Bakabilmek

7 Açıklayıcı Analizler Amaç: Verili bir sette olası ilişkileri keşfetmek ya da öngörülen hipotezleri test etmek

8 Görünen....

9 Görünenin Arkası.... Genel Ortalama: 51, Std. Sapma: 22
Kadınlar Ortalama: 46, Std. Sapma: 23 Erkekler Ortalama: 46, Std. Sapma: 21

10 Örnek: Internet Kullanımı

11 Ve Görünenin Arkası... Erkekler Kadınlar

12 Açıklayıcı Analizler Amaç: İlk bakışta görül(e)meyen ilişkileri sergileyip ilişkisel açıklamalar getirmek Y= f(x) ie: İnternet kullanımı= f(cinsiyet) ie: Yaşam biçimi= f(gelir) ie: Tüketim kalıpları= f(yaşam biçimi)

13 Örnek: Gelişmişlik ve Yaşam Kalitesi
BM verilerinden elde edilen bir tablo... Araştırma sorusu: Gelişmişlik ve Yaşam Kalitesi arasındaki ilişki İşlemleştirme: Gelişmişlik: Kişi Başına Düşen GSMH Yaşam Kalitesi: Çocuk ölümleri

14 Gruplanmış Veri   

15 Scatterplot

16 Sorular Ne Kadar Yeterli? Grafiği ne kadar temsil ediyor?
Ne gibi çıkarımlar yapabiliyoruz? “Forecasting” yapılabiliyor mu? İlişkinin “boyutu” ve “yönü” ölçülebiliyor mu? Ne Kadar Yeterli?

17 Amaç: Daha iyi analiz, daha iyi veri
Covariance (kovaryans) Correlation Coefficient (korelasyon)

18 Sonuçlar Covariance: 2115,318 Correlation: -0,60165
Çıkarılacak Sonuç Ne?

19 Amaç: Nedensel İlişkileri Göstermek
Y= f(x) X, Y’nin belirleyicisi mi? X, Y’yi ne kadar belirliyor? X, Y’yi ne yönde belirliyor?

20 Regresyon Analizi Y= f(x) Y= a+bx Regresyon Denklemi:

21 Scatterplot

22 Regresyon Katsayılarının Hesaplanması

23 Regresyon Analizi Sonuçları

24 Regresyon Analizinin Açılımları
Çoklu Regresyon Kukla Değişkenli Regresyon (Dummy Variable) Binomial/Multinomial Regression

25 Regresyon Analizinin “cız-kaka”ları
Arkasında çok ciddi üç varsayım vardır. Regresyon analizi sadece “interval” ya da “ratio” ölçümleme düzeyinde yapılır “Do not use any mathematical model without understanding it”

26 Kümeleme ve Birleştirme Analizleri
Bütün olgular birbiriyle ilişkilidir. Aradaki ilişkinin 0 olduğu yerde bile... Birleştirme analizlerinin amacı olguların birbirleriyle olan ilişkilerinden yola çıkarak işimizi kolaylaştırmaktır 1. Değişken sayısını azaltabilirler 2. Vaka sayısını azaltabilirler 3. Boyut sayısını azaltabilirler

27 Faktör Analizi: Değişken Sayısını Azaltmak
Analize tabi bütün değişkenler birbiriyle ilişkili. Bu değişkenlerin bazıları birbirleriyle daha kuvvetli ilişki sahibi. Kuvvetli ilişki sahibi değişkenleri birleştirerek aza indirmek mümkün. Değişkenlerarası korelasyon matrisi kullanılarak “faktör”ler inşa ediliyor

28 Faktör Analizi

29 “Case” Sayısı Azaltmak: Clustering
Verili değişkenler bazında analize alınan “case”ler birbirlerine benzerler Bu benzerlik bir ya da daha fazla boyutta olabilir Benzerliklerden yola çıkarak “clusters” oluşturmak mümkün Benzerlikler metric mesafelerle ölçülüyor

30 Cluster Analysis I

31 Cluster Analysis II

32 Cluster Analysis III

33 Boyut Sayısını Azaltmak: MDS
Analizde gözönünde tuttuğumuz her değişken bir “boyut” sayılabilir. İki-üç boyuttan fazlasını “visualize” etmek kolay değil. Değişkenler arasındaki uzaklıktan yola çıkılarak bu boyut sayısı azaltılabilir. Değişkenler arasındaki uzaklıklar metric olarak ölçülebilir

34 MDS

35 Ve mutlu son.... “İstatistiksel araçlarınız ne kadar güçlü, ne kadar gelişmiş olursa olsun, unutmamanız gereken tek şey var: Bu verileri okuma yazması olmayan demiryolu bekçileri topladı” Sir John Maynard Keynes


"İleri İstatistik Teknikleri" indir ppt

Benzer bir sunumlar


Google Reklamları