Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Kİ-KARE DAĞILIMI VE TESTİ Kİ-KARE TESTLERİ Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ Ki-Kare İyi Uyum Testi A) BELİRLİ BİR VERİ YAPISINA UYGUNLUĞUN TESTİ B)BELİRLİ.

Benzer bir sunumlar


... konulu sunumlar: "Kİ-KARE DAĞILIMI VE TESTİ Kİ-KARE TESTLERİ Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ Ki-Kare İyi Uyum Testi A) BELİRLİ BİR VERİ YAPISINA UYGUNLUĞUN TESTİ B)BELİRLİ."— Sunum transkripti:

1 Kİ-KARE DAĞILIMI VE TESTİ Kİ-KARE TESTLERİ Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ Ki-Kare İyi Uyum Testi A) BELİRLİ BİR VERİ YAPISINA UYGUNLUĞUN TESTİ B)BELİRLİ BİR DAĞILIŞA UYUM TESTLERİ 1) BİNOM DAĞILIŞA UYGUNLUK TESTİ 2) POİSSON DAĞILIŞA UYGUNLUK TESTİ 3) UNİFORM (KESİKLİ) DAĞILIŞA UYGUNLUK TESTİ 4) NORMAL DAĞILIŞA UYGUNLUK TESTİ Ki-Kare Homojenlik Testi Ki-Kare Bağımsızlık Testi 1

2 Kİ-KARE DAĞILIMI VE TESTİ Ki-kare testi, istatistiksel araştırmalarda kullanılan değişkenlerin genellikle hepsinin nitel (sayısal olmayan) ya da birinin nicel, diğerinin nitel olması durumlarında uygulanan ve uygulama kolaylığı nedeniyle tercih edilen bir testtir. Ki-kare testinin esası Karl Pearson tarafından 1900 yılında yazılan bir makalede ki-kare dağılımına dayandırılmıştır. 2

3 Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ Örnekleme yoluyla elde edilen rakamların, anakütle rakamlarına uygun olup olmadığı; bir başka ifadeyle gözlenen değerlerin teorik (beklenen) değerlere uygunluk gösterip göstermediği ki-kare testi ile belirlenir. Standart normal değişken Z İ değerlerinin; şeklinde karesi alındığında, değerlerinin dağılımı ki-kare dağılımına dönüşür. 3

4 X tesadüfi değişken dağılımından bir değer seçilip standart hale dönüştürülür ve karesi alınırsa X değişkeninin dağılımı ki-kare dağılımına dönüşür. Normal dağılım gösteren bir X tesadüfi değişken dağılımından tesadüfi ve birbirinden bağımsız olarak iki değer seçilsin. Seçilen değerleri; şeklinde standart hale dönüştürülsün. 4

5 Bu Z değerlerinin kareleri alınıp toplanırsa elde edilen değişkeni ki-kare dağılımı gösterir. N adet örnek için bu prosedür takip edildiğinde; değişkeni de ki-kare dağımı gösterir. 5

6 Ki-kare dağılımı diğer ki-kare dağılımlarından serbestlik derecelerine göre ayrılır. Kareleri alınıp toplandığında, ki-kare dağılımı gösteren bağımsız standart normal değer sayısına serbestlik derecesi denir. Bir ki-kare dağılımının ortalaması, dağılımın serbestlik derecesine ve varyansı, serbestlik derecesinin iki katına eşittir. Mesela, serbestlik derecesi 10 olan bir ki-kare dağılımının ortalaması 10 ve varyansı 20’dir. 6

7 Ki-kare değişkeni, sembolü ile gösterilir. Bir dağılımı diğerinden ayırmak için bu sembole serbestlik derecesini gösteren bir indis eklenebilir. Böylece 1, 2 ve n serbestlik dereceleriyle ki- kare dağılım gösteren değişkenler, ve şeklinde gösterilebilir. 7

8 Ki-kare dağılımı sağa çarpıktır ve normalden daha diktir. N büyüdükçe merkezi limit teoreminin bir sonucu olarak diklik ve asimetri azalır ve dağılım normale yaklaşır. Ki-kare değerleri 0 ilearasında değişir. 8

9 İyi Uyum Testi Varsayımları: 1. Çok değerli kategorik veri 2. Tek bir örnek, birden çok ilgilenilen oran 3. Örnek oranları hakkında varsayılan oranların test edilmesi Homojenlik Testi Varsayımları: 1. Tek bir kategorik değişken 2. Her gruptan alınan ayrı birer örnek 3. Varsayılan oran yok 4. Bir grup için oranın diğer grup veya gruplar için de aynı olup olmadığının test edilmesi Bağımsızlık Testi Varsayımları: 1. İki kategorik değişken 2. Sadece tek örnek, oranlarla ilgili varsayım yok 3. Bir kategorik değişkenin diğeriyle ilişkili olup olmadığının test edilmesi Ki-Kare Testleri 9

10 OLAY 1: Genelde bir istatistik sınıfında, öğrencilerin %60’ının devamlı, %30’unun bazen, %10’unun ise çok az derse geldikleri düşünülmektedir. Sizin sınıfınızdan 30 kişilik bir örnek alınmış ve %65’inin devamlı, %20’sinin bazen, ve %15’inin çok az derse geldiği bulunmuştur. Bu sınıfın devam durumunun genel devam durumuna uyduğu söylenebilir mi? OLAY 2: Aynı öğretim üyesinin istatistik dersi verdiği 3 farklı sınıfta devam durumlarının aynı olup olmadığı araştırılmaktadır. Her üç sınıftan alınan ayrı örneklerin sonucu aşağıdaki tabloda görüldüğü gibidir. OLAY 3: Bu fakültedeki devam durumu ile geçme notu arasında bir ilişki olup olmadığı araştırılmak istenmektedir. Fakülte öğrencilerinden alınan 100 kişilik bir örneğe devam durumları ile geçme notları sorulmuş ve aşağıdaki tablo elde edilmiştir: 10

11 Ki-Kare İyi Uyum Testi Varsayımları: 1. Çok değerli kategorik veri (2’den fazla kategorisi olan kategorik değişken) 2. Tek bir örnek, birden çok ilgilenilen oran 3. Örnek oranları hakkında varsayılan oranların test edilmesi 11

12 Bilinen varsayılan oranlar Bilinmeyen varsayılan oranlar a) Belirli bir veri yapısına uygunluğun test edilmesi b) Belirli bir dağılıma uygunluğun test edilmesi Varsayılan Oranlar 12

13 Belirli bir örnekteki verilerin belirli bir veri yapısına (genel yapıya) uygunluğunu belirlemek için; örnekten elde edilen verilerin (gözlenen verilerin) önceden elde edilen (varsayılan) yapıya uyup uymadığı test edilir. A) BELİRLİ BİR VERİ YAPISINA UYGUNLUĞUN TESTİ 13

14 Genelde bir istatistik sınıfında, öğrencilerin %60’ının devamlı, %30’unun bazen, %10’unun ise çok az derse geldikleri düşünülmektedir. Sizin sınıfınızdan 100 kişilik bir örnek alınmış ve %65’inin devamlı, %20’sinin bazen, ve %15’inin çok az derse geldiği bulunmuştur. Bu sınıfın devam durumunun genel devam durumuna uyduğu söylenebilir mi? H 0 : P devamlı =0.60, P bazen =0.30, P çok az =0.10 H 1 : En az bir oran varsayılandan farklıdır. Örnek 14

15 H 0 : P devamlı =0.60, P bazen =0.30, P çok az =0.10 H 1 : En az bir oran varsayılandan farklıdır. Bu hipotez testini uygulamak için gözlenen ve beklenen değerler arasındaki farkların büyüklüğüne bakmak gerekir. Bu farkların mutlak değeri ne kadar büyükse, sıfır hipotezi hakkında o kadar kuşkuya düşeriz. Sıfır hipotezi doğruyken ve örnek orta büyüklükteyken (beklenen değerlerin (E i ) herbiri en az 5 ise), bu hipotez testi için aşağıdaki Ki-Kare test istatistiği kullanılır : O: Gözlenen değer E: Beklenen değer Bu test istatistiği, k-1 serbestlik dereceli tablo değeriyle karşılaştırılır. (Burada k: kategori sayısıdır. =3) 15

16 H 0 : P devamlı =0.60, P bazen =0.30, P çok az =0.10 H 1 : En az bir oran varsayılandan farklıdır. Beklenen değer = örnek hacmi x beklenen olasılık  E i = n x p i Gözlenen değer = örnek hacmi x gözlenen olasılık  O i = n x r i N=100

17 1 ) H 0 : P devamlı =0.60, P bazen =0.30, P çok az =0.10 H 1 : En az bir oran varsayılandan farklıdır. 2) 3) 4) Yorum: %5 hata olasılığı ile, en az bir oran diğerlerinden farklı olduğu için, bu sınıfın devam durumu, genel devam durumu yapısına uymamaktadır. 17

18 B)BELİRLİ BİR DAĞILIŞA UYUM TESTLERİ Örnek verilerinden yola çıkarak populasyonun dağılımı hakkında ortaya atılan iddiayı test etmek için Dağılışa Uyum Testleri kullanılır. H 0 : Örnek verileri ilgili dağılışa uygundur. H 1 : Örnek verileri ilgili dağılışa uygun değildir. Test İstatistiği: Hipotezler : Belirli bir anakütleden çekilen tesadüfi örnekler bu anakütlelerin karakteristiklerini yansıtır veya yansıtması beklenir. Bu yüzden belirli bir anakütleden bir örnek çekilirse gözlenen ve beklenen frekanslar arasında yakın bir ilişkinin olması beklenir. 18

19 Sıfır hipotezi doğruysa gözlenen ve beklenen frekanslar arasında yakın bir ilişki var demektir. Gözlenen ve beklenen frekanslar arasındaki uyumu ki- kare testi ile ortaya koyarız. v = r -k –1H 0 reddedilebilir. Parametre tahmini: Örnek verilerinden parametre tahmini yapmak zorunda kaldığımız her bir parametre için r-1 den 1 çıkarırız. Örnek verilerinden tahmin etmek zorunda kaldığımız parametre sayısını k ile gösterdiğimizde serbestlik derecesi v=r-k-1 olur. 19

20 I) BİNOM DAĞILIŞA UYGUNLUK TESTİ H 0 : Örnek verileri binom dağılışına uygundur. H 1 : Örnek verileri binom dağılışına uygun değildir. Test İstatistiği: Binom formülü yardımı ile bir x olayının olasılığı; Binom dağılımının parametresi p’dir. Bu değer bilinmediğinde elimizdeki verilerden hareketle şeklinde tahmin edilir. 20

21 Tahmin edilen bu değer yardımıyla binom formülünden x değerlerine ait olasılıklar hesaplanır. Gözlenen frekanslar toplamı, hesaplanan bu olasılıklarla çarpılarak beklenen frekanslar hesaplanır. Gözlenen ve beklenen değerlerden yararlanılarak, test istatistiği Karar: Binom dağılımının bir parametresi olduğu için (p) serbestlik derecesi, v = r- k -1 = v = r olur. Bulunan test istatistiği v = r -2 serbestlik derecesi ve  önem seviyesine göre tablodan bulunacak ki-kare değerine eşit veya bu değerden büyük ise  önem seviyesinde sıfır hipotezi reddedilir. bulunur. 21

22 ÖRNEK: Bir firma ürünlerini 5’er birimlik koliler halinde piyasaya sunmaktadır. İmalattan tesadüfi olarak seçilen 280 koli açılmış ve içlerindeki kusurlu ürün sayısına göre koliler aşağıdaki gibi sınıflandırılmıştır. Kusurlu ürün sayısı(x) Koli Sayısı(f) Bu verilere göre kusurlu ürün dağılımının binom dağılımına uygun olup olmadığını %1 önem seviyesinde test ediniz. 22

23 H 0 : Örnek verileri binom dağılışına uygundur. H 1 : Örnek verileri binom dağılışına uygun değildir. ÇÖZÜM: Araştırmaya konu olan toplam 5*280 = 1400 ürün vardır. Toplam kusurlu sayı ise; (0)(157)+(1)(69)+(2)(35)+(3)(17)+(4)(1)+(5)(1) = 199 Kusurlu mamul oranı: n=5  f=280 23

24 Formülünde sırasıyla x’ler yerine konursa; beklenen nispi frekanslar ve bu her bir nispi frekansı da 280 ile çarptığımızda beklenen frekansları elde ederiz. Son iki değer 5’den küçük olduğu için toplanarak ( =0.51) dördüncü beklenen değere eklenir. ( =6.19). Kusurlu ürün sayısı Koli Sayısı (f)fx Bek. Nisbi Frekanslar Beklenen frekans (  f.bekl.nisbi fre.) 01570* *0.4704= * *0.3829= * *0.1247= * *0.0203= * *0.0017= * *0.0001= n=5  f=280 n  f=5.(280)=

25 Beklenen nispi frekansın elde edilişi

26 Kusurlu ürün sayısıKoli Sayısı (f) Gerçek frekans Beklenen frekans = =

27 v = 4 – 1- 1=2 serbestlik dereceli  = 0.01 önem düzeyinde  2 = 9.21 H 0 reddedilebilir. Örnekteki verilerin binom dağılımı gösteren bir anakütleden çekilmemiş olduğuna karar verebiliriz. 27

28 II) POİSSON DAĞILIŞA UYGUNLUK TESTİ H 0 : Örnek verileri poisson dağılışına uygundur. H 1 : Örnek verileri poisson dağılışına uygun değildir. Test İstatistiği: Poisson formülü yardımı ile bir x olayının olasılığı; Poisson dağılımının parametresi ’dir. Bu değer bilinmediğinde elimizdeki verilerden hareketle şeklinde tahmin edilir. 28

29 Tahmin edilen bu değer yardımıyla Poisson dağılımı formülüne göre x değerlerine ait olasılıklar hesaplanır. Çeşitli değerlerine göre x değerlerinin gözlenme olasılıkları Poisson tablosunda verilmiştir. Gözlenen frekanslar toplamı bu olasılıklarla çarpılarak beklenen frekanslar elde edilir. Gözlenen ve beklenen değerlere göre test istatistiği; formülü ile hesaplanır. KARAR: Poisson dağılımının bir parametresi vardır. Serbestlik derecesi v=r-1-k=r-1-1 =r-2 olur. Bulunan test istatistiği v= r – 2 serbestlik dereceli ve  önem düzeyine göre tablodan bulunacak ki-kare değerine eşit veya bu değerden büyük ise  önem seviyesinde H 0 hipotezi reddedilir. 29

30 ÖRNEK: Belli bir zaman aralığında bir yurda giren öğrenciler sayılmış ve aşağıdaki sonuçlar elde edilmiştir. Müşahade Edilen Öğrenci Sayısı(x i ) Zaman Aralığı Sayısı (O i ) O i x i Toplam Bu verilen Poisson dağılımına uygunluğunu %1 önem seviyesinde test ediniz. 30

31 H 0 : Örnek verileri poisson dağılışına uygundur. H 1 : Örnek verileri poisson dağılışına uygun değildir. Poisson parametresi bilinmediğinden, örnekteki veriler yardımıyla bu değeri olarak tahmin ederiz. 0, 1, 2, 3, 4, 5, 6, 7 öğrenci için beklenen nispi frekansları Fonksiyonu veya Poisson olasılıkları tablosundan yararlanarak hesaplanır. = 2.8 değerine göre tablodan x değerleri için olasılıklar bulunabilir. Bu olasılıklar 300 ile çarpılarak beklenen frekanslar elde edilebilir. 31

32 xOiOi EiEi O i - E i (O i - E i ) 2 (O i - E i ) 2 / E i  2 =24.65 v = 8 – 2 =6 serbestlik dereceli  = 0.01 önem düzeyinde  2 = H 0 reddedilebilir. Örnekteki verilerin poisson dağılımı gösteren bir anakütleden çekilmemiş olduğuna karar verebiliriz. 32

33 III) UNİFORM (KESİKLİ) DAĞILIŞA UYGUNLUK Uniform dağılış, tanımlı olduğu değerleri eşit olasılıklar alan şans değişkenlerinin dağılışıdır. Bu dağılışı gösteren bir şans değişkeni N farklı değeri eşit olasılıklar ile alıyorsa her bir değeri alma olasılığı 1/N’e eşittir. 33

34 ÖRNEK Bir medya araştırma şirketi, 6 televizyon programının tercih edilme durumunu tespit etmek istiyor. Bu amaçla 60 izleyiciden oluşan tesadüfi bir örnek çekiyor. Tercihler şöyledir: Program Tercih Sayısı Bu verilerden yola çıkarak 6 programın eşit olarak tercih edildiğini söyleyebilir miyiz? CEVAP: Eşit tercih edilme olup olmadığını anlayabilmek için izleyici tercihlerinin uniform dağılış göstermesini bekleriz. 34

35 H 0 : 6 program eşit olarak seyrediliyor. H 1 : 6 program eşit olarak seyredilmiyor. Beklenen Değer: E i : Toplam Gözlem Sayısı / Sınıf Sayısı E i : 60 / 6 =10 Program Gözlenen Tercih Sayısı(O i ) Beklenen Tercih Sayısı(E i )

36 H 0 reddedilemez, izleyiciler 6 programı eşit olarak seyretmektedir. Uniform dağılışta tahmin edilen parametre sayısı 0 olduğu için g, 0’dır. v = k-1-0 = k-1 36

37 37 Kimyasal bir madde üreten bir firma günlük satışlarının (1000 galon) normal dağılışa uygun olup olmadığını araştırmak istemektedir. Bu amaçla 200 gün boyunca satılan miktarlar kayıt edilerek aşağıdaki sınıflanmış veri seti elde edilmiştir. Buna göre %5 hata payıyla satışların normal dağılışa uygun olup olmadığını test ediniz. Örnek IV) NORMAL DAĞILIŞA UYGUNLUK TESTİ

38 38 Satışlar (1000 galon)Satılan Gün Sayısı x < 34,00 34,0 ≤ x < 35,513 35,5 ≤ x < 37,020 37,0 ≤ x < 38,535 38,5 ≤ x < 40,043 40,0 ≤ x < 41,551 41,5 ≤ x < 43,027 43,0 ≤ x < 44,510 44,5 ≤ x <46,01 46,0 ≤ x0 Toplam200

39 39 Uyumu araştırılacak dağılış olan normal dağılışın parametreleri ifade edilmediğinden verilen örnekten yola çıkılarak örnek istatistikleri tahmin edilir. Her bir sınıfa ait olan olasılık değerleri sınıflanmış verilerin aralığına düşmesi olasılığına karşılık gelir. Anakütle dağılışının uygun olduğu varsayılan normal dağılışla ilişkin olasılık hesaplamaları standart normal dağılışa (z) dönüştürme yoluyla hesaplanır.

40 40 Hesaplanan bu olasılıklar toplam örnek hacmiyle çarpılarak beklenen değerler elde edilir. B 1 = np 1 = 0,0082 * 200 = 1,64 B 6 = np 6 = 0,2257 * 200 = 54 H 0 : Satışlar normal dağılışa uygundur. H 1 : Satışlar normal dağılışa uygun değildir.

41 41 SatışlarGiGi p i B i = np i G i - B i (G i - B i ) 2 /B i x < 34,000,00821,64 5,824, ,0 ≤ x < 35,5130,02275,54 35,5 ≤ x < 37,0200,079215,84 4,161, ,0 ≤ x < 38,5350,159231,84 3,160, ,5 ≤ x < 40,0430,225745,14 -2,140, ,0 ≤ x < 41,5510,225745,14 5,860, ,5 ≤ x < 43,0270,159231,84 -4,840, ,0 ≤ x < 44,5100,079215,84 -5,842, ,5 ≤ x <46,010,02775,54 -6,185, ,0 ≤ x00,00821,64 G 1 =13, B 1 = 7,18 G 8 =1, B 8 = 6,18

42 42 v = k - 1- g = =5 olduğundan H 0 reddedilir. Firmanın günlük satışlarının normal dağılışa uygun olmadığı %5 hata payıyla söylenebilir.

43 Ki-Kare Homojenlik Testi Homojenlik testinde her bir anakütleden belirli hacimlerde örnekler çekilir ve bu örneklerin belirli bir karakteristiği taşımaları bakımından benzer değişim gösterip göstermediklerine karar verilir. Varsayımları: 1. Tek bir kategorik değişken 2. Her gruptan alınan ayrı birer örnek 3. Varsayılan oran yok 4. Bir grup için oranın diğer grup veya gruplar için de AYNI (HOMOJEN) olup olmadığının test edilmesi 43

44 Aynı öğretim üyesinin istatistik dersi verdiği 3 farklı sınıfta devam durumlarının aynı olup olmadığı araştırılmaktadır. Her üç sınıftan alınan ayrı örneklerin sonucu aşağıdaki tabloda görüldüğü gibidir. H 0 : sınıf1’in devam yapısı = sınıf2’nin devam yapısı = sınıf3’ün devam yapısı H 1 : En az bir sınıfın devam yapısı diğerlerinden farklıdır. Bu test istatistiği, (k-1)(r-1) serbestlik dereceli tablo değeriyle karşılaştırılır. Burada k: kategori sayısı (sütun sayısı), r: grup sayısı (satır sayısı) 44 ÖRNEK

45 H 0 : sınıf1’in devam yapısı = sınıf2’nin devam yapısı = sınıf3’ün devam yapısı H 1 : En az bir sınıfın devam yapısı diğerlerinden farklıdır. Hesaplamaları ayrı tablolarla yapılır. 45

46 =2

47 1) H 0 : sınıf1’in devam yapısı = sınıf2’nin devam yapısı = sınıf3’ün devam yapısı H 1 : En az bir sınıfın devam yapısı diğerlerinden farklıdır. 2) 3) 4) Yorum: %5 hata olasılığı ile, sınıfların devam yapısının birbirinden farklı olduğu söylenemez. 47

48 Ki-Kare Bağımsızlık Testi Sık sık karşılaşılan araştırma sorularından biri de iki değişkenin birbiri ile ilişkili olup olmadığıdır. Mesela, bir sosyolog okul aracılığıyla kazanılan eğitim seviyesinin gelirle ilişkili olup olmadığını araştırmak isteyebilir. Bir okulda çalışan beslenme uzmanı öğrencilerin beslenme seviyelerinin akademik performanslarıyla ilişkili olup olmadığını bilmek isteyebilir. 48

49 Varsayımları: 1.İki kategorik değişken 2. Sadece tek örnek, oranlarla ilgili varsayım yok. 3. Bir kategorik değişkenin diğeriyle İLİŞKİLİ olup olmadığının test edilmesi İki değişken arasında ilişki yoksa, birisinin dağılımı hiçbir şekilde diğerinin dağılımına bağımlı değilse bu iki değişken birbirinden bağımsızdır denir. İki değişken arasında ilişki yoksa, belirli bir değişkenin değerini bilmek, diğer değişkenin değerini belirlemeye imkan sağlamaz. 49

50 Bu fakültedeki devam durumu ile geçme notu arasında bir ilişki olup olmadığı araştırılmak istenmektedir. Fakülte öğrencilerinden alınan 100 kişilik bir örneğe devam durumları ile geçme notları sorulmuş ve aşağıdaki tablo elde edilmiştir: H 0 : Devam yapısı, geçme notu ile ilişkili değildir. H 1 : Devam yapısı, geçme notu ile ilişkilidir. Bu test istatistiği, (k-1)(r-1) serbestlik dereceli tablo değeriyle karşılaştırılır. Burada k: sütun sayısı, r:satır sayısı 50

51 H 0 : Devam yapısı, geçme notu ile ilişkili değildir. H 1 : Devam yapısı, geçme notu ile ilişkilidir. 51

52 52

53

54 1) H 0 : Devam yapısı, geçme notu ile ilişkili değildir. H 1 : Devam yapısı, geçme notu ile ilişkilidir. 2) 3) 4) Yorum: %5 hata olasılığı ile, devam yapı ile geçme notu değişkenlerinin ilişkili olduğuna dair yeterli kanıt bulunamamıştır. 54


"Kİ-KARE DAĞILIMI VE TESTİ Kİ-KARE TESTLERİ Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ Ki-Kare İyi Uyum Testi A) BELİRLİ BİR VERİ YAPISINA UYGUNLUĞUN TESTİ B)BELİRLİ." indir ppt

Benzer bir sunumlar


Google Reklamları