Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Çıkarsamalı İstatistik Yöntemler Doç.Dr.Hayal BOYACIOĞLU Ege Üniversitesi Fen Fakültesi İstatistik Bölümü

Benzer bir sunumlar


... konulu sunumlar: "Çıkarsamalı İstatistik Yöntemler Doç.Dr.Hayal BOYACIOĞLU Ege Üniversitesi Fen Fakültesi İstatistik Bölümü"— Sunum transkripti:

1 Çıkarsamalı İstatistik Yöntemler Doç.Dr.Hayal BOYACIOĞLU Ege Üniversitesi Fen Fakültesi İstatistik Bölümü

2 İçerik Çıkarsamalı İstatistik Yöntemlerin Kullanım Alanları İstatistiksel Testin Seçimini Etkileyen Faktörler Normal Dağılım Hipotez Testleri Varyans Analizi Regresyon Analizi

3 Çıkarsamalı İstatistik İ lgili kitleden belirli yöntemlerle elde edilen örnek verilerinin uygun analizlere dayanarak kitle ile ilgili çıkarsamalar yapılmasıdır.

4 Çıkarsamalı İstatistiksel Yöntemlerin Kullanım Alanları Örneklemden elde edilen sonuçların tesadüfe bağlı olup olmadığını (önemli olup olmadığını) belirlemek amacıyla uygulanan testlerdir. Burada ifade edilen önemlilik (significancy) elde edilen sonuçların tesadüfe bağlı olmadığını, yani istatistiksel açıdan anlamlı olduğunu ifade eder

5 Çıkarsamalı İstatistiksel Yöntemlerin Kullanım Alanları İstatistiksel önemlilik testleri çeşitli durumlarda ve farklı amaçlarla uygulanır. Bu testlerin başlıca kullanım alanları : 1. Kitleden seçilen tek örneklemden elde edilen veriler yardımıyla, kitle parametresinin belli bir değere eşit olup olmadığının test edilmesinde. 2. Kitleden seçilen iki ya da daha fazla grup arasındaki farkın önemli olup olmadığının test edilmesinde. 3. Aynı grupta farklı koşullar altında elde edilen veriler arasındaki farkın önemli olup olmadığının test edilmesinde. 4. Bir örnek gruptan elde edilen dağılışın belli bir teorik dağılışa uygun olup olmadığının test edilmesinde

6 Önemlilik Testinin Seçimini Etkileyen Faktörler Önemlilik testlerinin uygulanmasında en önemli adım, uygulanacak testin doğru seçilmesidir. Uygun testin seçiminde göz önünde bulundurulması gereken çeşitli faktörler vardır. 1. Verinin karakteri Ölçümle ve sayımla belirtilen veriler farklı dağılış özellikleri gösterirler. Ölçümle belirtilen veriler sürekli, sayımla belirtilen veriler ise kesikli dağılış özelliğine sahiptir. Bu nedenle, genel olarak ölçümle ve sayımla belirtilen verilerde farklı testler kullanılır.

7 Önemlilik Testinin Seçimini Etkileyen Faktörler 2. Grup sayısı Test edilecek veriler; bir, iki veya ikiden fazla gruba ayrılmış olabilir. Grup sayısının ikiden fazla olması, çoklu karşılaştırma olarak kabul edilir. Grup sayısı uygulanacak testin seçimini etkiler.

8 Önemlilik Testinin Seçimini Etkileyen Faktörler 3. Örneklem büyüklüğü (veri sayısı) Gruplardaki veri sayısı hem uygulanacak testin seçimini hem de elde edilen test sonucunun güvenirliğini etkiler. Bazı testlerin uygulanabilmesi için gruplarda belli sayıda veri bulunması gerekir.

9 Önemlilik Testinin Seçimini Etkileyen Faktörler 4. Gruplarda bağımsızlık durumu Grupların ayrı ayrı bireylerden oluşması ve bir deneğin seçiminin diğeri ile bağlantılı olmaması durumunda gruplar bağımsızdır. Aynı bireyler üzerinde gözlemlerin tekrarlanması ya da bireylerin tek tek birbirinin eşi olarak seçildiği durumlarda ise gruplar bağımlıdır.

10 Önemlilik Testinin Seçimini Etkileyen Faktörler 5. Örneklemin alındığı kitlenin dağılımı Kitlenin dağılımının normal dağılıma uygunluğu kullanılacak istatistik analiz yönteminin önemli belirleyicilerindendir.

11 Normal Dağılım Gaussian Dağılımı Simetrik bir dağılımdır. Normal Dağılımın Parametreleri E(x)=μ Var(x)=σ 2

12 Normal Dağılım

13 Aritmetik Ortalama ve Medyan birbirine yakın değer almalı Histogram grafiği simetrik olmalı. Box plot grafiği simetrik olmalı. Normal probability plot grafiği doğrusal olmalıdır.

14 Normal Dağılım

15 Normal Dağılıma Uygunluğun Değerlendirilmesi *Histogram and Boxplot *Normal Quantile Plot *Goodness of Fit Tests *Shapiro-Wilk Test (JMP) *Kolmogorov-Smirnov Test (SPSS) *Anderson-Darling Test (MINITAB)

16 Veri Dönüşümü – Logaritmik dönüşüm – Karekök – 1/y – Kare – Logit dönüşüm – Z skoru

17 Logaritmik Dönüşüm

18 Kare Dönüşümü

19 Aralık Tahmin ve Hipotez Testleri Tahmin edici: Kitle parametresini tahmin etmek için kullanılan örnek istatistiğine tahmin edici adı verilir. Tahmin: Tahmin edicinin almış olduğu değere tahmin denir.

20 Aralık Tahmin ve Hipotez Testleri Nokta tahmini: Bir kitle parametresini tahmin etmek için kullanılan örnek istatistiğinin değerine nokta tahmini adı verilir. Aralık tahmini: Bir parametrenin aralık tahmini, parametreyi tahmin etmek için kullanılan değerleri içeren bir aralıktır.

21 Aralık Tahmin ve Hipotez Testleri Tahminin güven düzeyini kullanarak bir parametre için belirlenen aralığa güven aralığı denir. En çok kullanılan güven aralıkları %90, %95 ve %99’ dur. Bir parametrenin bir aralık tahminin güven düzeyi, parametreyi kapsama olasılığıdır. 1-α ile gösterilir. Burada α anlamlılık düzeyi adını alır.

22 Aralık Tahmin ve Hipotez Testleri Kitle Ortalaması  için Aralık Tahmin  2 biliniyor ise  Z Testi  2 bilinmiyorsa fakat n>30 ise (Büyük Örneklem)  Z Testi  2 bilinmiyorsa ve n<30 ise (Küçük örneklem)  t Testi

23 Aralık Tahmin ve Hipotez Testleri

24 Hipotez Testi Geçerliliği olasılık esaslarına göre araştırılabilen ve karar verebilmek için öne sürülen varsayımlara istatistikte “hipotez” denir. Örneklem dağılımlarından elde edilen istatistiklere bağlı olarak, örneklem dağılımının, parametresi bilinen kitleye ait olup olmadığı araştırılır. Hipotezlerin örneklem yardımıyla incelenmesine “hipotez testi” denir.

25 Kitle Parametreleri KitleÖrnek μ σ S P

26 Hipotez Testi Karar Gerçek DurumHo Reddedilir.Ho Reddedilemez Ho Doğru1. Tip Hata(α)Doğru Karar(1-α) Ho YanlışDoğru Karar(1-β) Testin Gücü 2. Tip Hata(β)

27 ORTALAMA (  ) İÇİN HİPOTEZ TESTLERİ Çift kuyruklu Hipotez Testi Yön belirtilmez. Eşitlik var mı yok mu test edilir. H 0 :  = k H 1 :  ≠ k Tek Kuyruklu Hipotez Testleri – Sağ Kuyruklu Hipotez Testi: Parametre değerden büyük H 0 :  ≤ k H 1 :  > k – Sol Kuyruklu Hipotez Testi: Parametre değerden küçük H 0 :  ≥ k H 1 :  < k

28 Ortalamaya İlişkin Hipotez Testleri Kitle Varyansı σ 2 Biliniyor  Z-Testi Kitle Varyansı σ 2 Bilinmiyor ancak n>30  Z-Testi Kitle Varyansı σ 2 Bilinmiyor ve n<30  t-Testi Orana İlişkin Hipotez Testleri  Z-Testi Varyansa İlişkin Hipotez Testleri  Khi-Kare Testi

29 İki Ortalama Farkına İlişkin Hipotez Testleri Bağımsız Örnekler İle İki Ortalama Farkına İlişkin Hipotez Testleri Kitle Varyansları σ 1 2, σ 2 2 Biliniyor  Z-Testi Kitle Varyansları σ 1 2, σ 2 2 Bilinmiyor, n 1 ve n 2 <30  Varyans Homojenliği Varsayımı altında t-Testi

30 Bağımlı Örnekler ile Ortalama Farkına İlişkin Hipotez Testleri- paired t test İki OranFarkı İçin Hipotez Testi  Z-Testi İki Varyansa İlişkin Hipotez Testleri  F-Testi

31 Hipotez Testleri Z Testi Kitle Normal dağılım gösteriyor. 1.H 0 :  =  0 H 1 :  ≠  0 İki (Çift) Yönlü n, α belirlenir, > Tek yönlü < Tek yönlü 2.Test istatistiği ve dağılımı  N(0,1) 3. Red etme bölgeleri belirlenir.

32 Hipotez Testleri Z α/2 (Çift yönlü), Z α (Tek yönlü) değerleri bulunur. 4. Gözlenen değerlerden test istatistiği hesaplanır  Z hesap 5. Karar verilir | Z h |> Z α/2 veya İse H 0 hipotezi red edilir. | Z h |> Z α 6. Yorum yapılır.

33 Hipotez Testleri p-değeri: p-değeri örnekten uç veya daha ileri değer elde etme ihtimal istatistiğidir. p-değeri= gösterilen alandır.

34 Hipotez Testleri Sola dayalı test için :H 0 : µ = µ 0 H 1 : µ < µ 0 ise, p değeri=Pr(Z≥ | Z h | ) veya p değeri=Pr(Z≤ - Z h )

35 Hipotez Testleri Sağa dayalı test için H 0 : µ = µ 0 H 1 : µ >µ 0 ise, p değeri=Pr(Z≥ Z h )

36 Hipotez Testi Testin Önemlilik Düzeyleri p-değeri Önemlilik derecesi Sonuç Karar p>0,05 n.s Ho reddedilemez. p<0,05 * Ho Reddedilir. p<0,01 ** Ho reddedilir.

37 Hipotez Testi

38 Örnek Bir fabrikada üretilen boruların ağırlıkları normal dağılım göstermektedir ve ortalaması 300 kg, standart sapması 24 kg olarak hesaplanmıştır. Yeni geliştirilen bir üretim tekniğiyle üretilen boruların arasından rasgele 15 boru seçilmiş ve ağırlıkları aşağıda verilmiştir. α=0.01 önem düzeyinde yeni üretim tekniğinin boruların ağırlıklarını arttırdığı yönündeki iddiayı test ediniz.

39 X i =306, 298, 332, 261, 316, 327, 324, 320, 307, 322, 320, 300, 297, 299, Hipotezler: H 0 : µ = 300 H 1 : µ > 300, σ=24, n=15, α= Test İstatistiği ve dağılımı,  N(0,1) 3. Red Bölgesi : Z tablo =2.33

40 4: Karar : Z hesap =1.08 α=0.01. Ho hip. red edilemez. Kitle ortalamasına ilişkin %99 güven düzeyinde güven aralığı ( ; ) bulunur.

41 VARYANS ANALİZİ (ANOVA – ANalysis Of VAriance) k guptan elde edilen veri setinde Normal dağılım gösteren Y değişkeninin genel değişiminin (genel varyans) bu değişime etkide bulunan öğelerine (değişim kaynağı, source of variation) göre ayırarak analiz etmeyi sağlayan bir yöntemdir.

42 VARYANS ANALİZİ (ANOVA – ANalysis Of VAriance) Varsayımları: Örneklerin elde edildiği kitle normal ya da yaklaşık olarak normal dağılış gösterir. Örnekler bağımsızdır. Kitle varyansları eşittir.

43 Tek Yönlü Varyans Analizi ( k Bağımsız Örneklem Varyans Analizi) Ho: Ortalamalar arasında fark yoktur.(Ho: µ 1 = µ 2 =…=µ k ) H 1 : En azından bir ortalama diğerlerinden farklıdır.

44 Tek Yönlü Varyans Analizi ( k Bağımsız Örneklem Varyans Analizi) Doğrusal model: (Tek yönlü: Tesadüf+ 1 faktör) Bağımlı değişken değeri Y ij = µ + a i + e ij KARAR: F hesap > F tablo veya p<  ise Ho hipotezi red edilir.

45 Örnek Uygulama Aynı coğrafi bölge ve aynı toprak çeşidinden rasgele 24 parsel belirlemiştir. Bu 24 parselden 6 parsele nitrat, 6 parsele potasyum, 6 parsele fosfat ve dördüncü grupaki 6 parsele amonyum kimyevi gübreleri kullanılmış ve hasat mevsimi sonunda alınan buğday verimi (kg) aşağıdaki gibi elde edilmiştir.Tek yönlü varyans analizi uygulayarak gübre türlerinin verim üzerine etkilerinin aynı olup olmadığını inceleyiniz.

46 Tek Yönlü Varyans Analizi ( k Bağımsız Örneklem Varyans Analizi)

47 Ho: Ortalamalar arasında fark yoktur. (Ho: µ 1 = µ 2 =µ 3 =µ 4 ) H 1 : En azından bir ortalama diğerlerinden farklıdır.

48 Tek Yönlü Varyans Analizi ( k Bağımsız Örneklem Varyans Analizi) Excel’de Veri--> Data Anaysis -->Anova:Tek Etken (Anova: Single Factor)

49 Tek Yönlü Varyans Analizi ( k Bağımsız Örneklem Varyans Analizi)

50

51 Regresyon Analizi Değişkenler arasındaki ilişkinin incelenmesinde kullanılan tekniklerdendir. Basit doğrusal regresyon analizinde bir değişkenin (rasgele olan veya rasgele olmayıp matematiksel olabilen değişkenin) verilen değeri yardımı ile diğer değişkenin değerini hesaplamamıza veya kestirmemize yarayan eşitliğin belirlenmesi sağlanır. Basit doğrusal regresyon iki değişkenle ilgilidir. Bu değişkenlerden biri (bağımlı olan) rasgele değişken, diğeri (bağımsız olan) ise matematiksel değişkendir. Basit doğrusal regresyonda kestirimi yapılan eşitlik bir doğrunun ifadesidir. Eşitliğin kestirimi gözlem değerleri ile sağlanır.

52 Regresyon Analizi

53 Basit Doğrusal Regresyon

54

55

56

57

58 Örnek: Bir ilde ölçümlenmiş SO2(µg/m³ ) ve rüzgar hızı (m/s )değerleri aşağıdaki gibidir.Bu veri setine ait basit doğrusal regresyon model denklemini bulalım. SO2(µg/m³ )(y) rüzgar hızı (m/s )(x)

59 Excel’de Regresyon Analizi

60

61 Regresyon Denklemleri

62 Equation Model SummaryParameter Estimates R SquareFdf1df2Sig.Constantb1b2b3 Linear,6637,86714,04926,090-,732 Logarithmic,75512,30914,02526,040-2,438 Quadratic,7023,53823,16227,219-1,536,100 Cubic,8353,37332,23731,885-7,0171,693-,130 Compound,6798,44414,04426,131,969 S,79115,14814,0183,046,237

63 Sonuç Araştırmada, birden fazla yöntem kullanılıyorsa hangi sonucun elde edilmesinde hangi istatistiksel yöntemin kullanıldığı, Grup karşılaştırmalarında, neyin karşılaştırıldığı (ortalamalar, yüzdeler, medyanlar), Analiz sonucuyla bulunan p değerine göre, kurulan hipotezlerin reddedilip reddedilmediği ve bunun ne anlama geldiği belirtilmelidir.

64 Teşekkür ederim…


"Çıkarsamalı İstatistik Yöntemler Doç.Dr.Hayal BOYACIOĞLU Ege Üniversitesi Fen Fakültesi İstatistik Bölümü" indir ppt

Benzer bir sunumlar


Google Reklamları