İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
BAĞIMSIZ GRUPLARA İLİŞKİN HİPOTEZ TESTLERİ
BAĞIMSIZ K ÖRNEKLEM TESTLERİ PARAMETRİK OLMAYAN TESTLER İKİ ÖRNEKLEM TESTLERİ BAĞIMSIZ K ÖRNEKLEM TESTLERİ PARAMETRİK TESTLER PARAMETRİK OLMAYAN TESTLER TEK YÖNLÜ VARYANS ANALİZİ (ANOVA) KRUSKAL-WALLIS VARYANS ANALİZİ ÇOK GÖZLÜKİ-KARE TESTLERİ
TEK YÖNLÜ VARYANS ANALİZİ Parametrik test varsayımları sağlandığında, ölçümle belirtilen bir değişken yönünden ikiden fazla bağımsız grubun ortalamaları arasında fark olup olmadığını test etmek için kullanılır. İki ortalama arasındaki farkın anlamlılık testi için gerekli varsayımlar varyans analizi için de geçerlidir.
Varsayımlar Karşılaştırılacak gruplar normal dağılım göstermeli Grupların varyansları homojen olmalı Gruplar birbirinden bağımsız olmalı Hipotezler: H0: 1= 2= 3=...= k Ha: En az bir i farklıdır.
Ortalama T.. T.k T.3 T.2 T.1 Toplam x3k x33 x32 x31 x2k x23 x22 x21 Gruplar j. sütunun toplamı j. sütunun ortalaması Bütün gözlemlerin toplamı
Genel Kareler Toplamı: Grup İçi Kareler Toplamı: Gruplar Arası Kareler Toplamı: GnKT=GIKT+GAKT
Gruplar Arası Kareler Ortalaması: Gruplar İçi Kareler Ortalaması: F Hesap İstatistiği:
ANOVA TABLOSU Değişim Kaynağı Kareler toplamı Ser. Der. Kareler Ortalaması F Gruplar Arası GAKT k-1 GAKO GAKO/GIKO Grup İçi GIKT N-k GIKO Genel GnKT N-1
Varyans Analizi Sonucu Anlamlı Olduğunda Farklı Grupların Belirlenmesi Varyans analizi sonucunda gruplar arasında fark yoksa işlemler sona erer. Ancak, gruplar arasında fark varsa, farklılığın hangi grup ya da gruplar arasında olduğu farklı yöntemlerle araştırılabilir. Bu yöntemlere post-hoc testleri denir. Bu yöntemlerden en çok kullanılanları; LSD Sidak Tukey Dunnett’s C Bonferroni Dunnett’s T3
LSD Testi Örneklem genişlikleri eşit olduğunda(n1=n2=n3=...=nk=n) p<0.05 Örneklem genişlikleri eşit olmadığında(n1n2 n3 ... nk) p<0.05
Örnek: Adölesan dönemindeki 90 kız, yaş gruplarına göre (11-14, 15-18, 19-24) 3 gruba ayrılmıştır. Günlük kilo başına tükettikleri kaloriler hesaplanmıştır. Yaş gruplarına göre tüketilen kaloriler bakımından farklılık var mıdır?
Yaş Grupları 11-14 15-18 19-24 42.45 39.98 43.30 46.81 45.29 42.85 45.62 33.08 32.43 53.82 38.60 . 50.68 37.57 35.18 Toplam 1380.76 1193.82 1105.72 3680.30 Ortalama 46.02 39.79 36.86 40.89
Ha: En az bir i farklıdır. GAKT=GnKT-GIKT=3642.36-2327.31=1315.05
Grup ortalamaları arasında anlamlı bir farklılık vardır. GIKO=GIKT/(90-3)=2327.31/87=26.75 GAKO=GAKT/(3-1)=1315.05/2=657.53 F=GAKO/GIKO=657.53/26.75=24.58 ANOVA TABLOSU 1315.05 2 657.53 24.58 ,000 2327.31 87 26.75 3642.36 89 Gruplar Arası Grup İçi Toplam Kareler Toplamı sd Ortalaması F P değeri Grup ortalamaları arasında anlamlı bir farklılık vardır.
Hipotezler LSD İstatistiksel karar H0: 1= 2 6.23>2.64, H0 red. Gruplardaki kişi sayıları birbirine eşit olduğu için Hipotezler LSD İstatistiksel karar H0: 1= 2 6.23>2.64, H0 red. H0: 1= 3 9.16>2.64, H0: 2= 3 2.93>2.64,
KRUSKAL- WALLIS TESTİ Tek yönlü varyans analizinin parametrik olmayan karşılığıdır. Veriler ölçümle belirtildiği halde parametrik test varsayımları sağlanmıyorsa (gözlem sayısı az ya da gruplar normal dağılmıyor ise) Kruskal-Wallis testi kullanılır.
Testin aşamaları şu şekilde gerçekleşir: k grubun n1, n2,…, nk gözlemleri tek bir değişken altında küçükten büyüğe sıralanır. Tüm gözlemlere sıra numarası verilir. k grubun sıra numaraları ayrı ayrı toplanır(Rj) Test istatistiği şeklinde hesaplanır. Grup sayısı j. gruptaki sıra sayıları toplamı j. gruptaki gözlem sayısı
Üç grup olduğunda ve her bir grupta beş ve daha az gözlem olduğunda hesaplanan KW istatistiği, özel tablolar kullanılarak karşılaştırılır. Bir ya da daha fazla grupta beşten fazla gözlem olduğunda ise KW, k-1 serbestlik dereceli 2 tablo değeriyle karşılaştırılır.
Test Sonucu Anlamlı Olduğunda Farklı Grupların Belirlenmesi ANOVA’da olduğu gibi bu Kruskal-Wallis testi de tüm gruplar arasında anlamlı bir farklılık olup olmadığını belirtir. Hangi gruplar arasında farklılık olduğunu vermez. Bunun için çoklu karşılaştırma yapmak gerekir. p<0.05
Örnek: Üniversite öğrencilerinin çay içme miktarına göre hemoglobin düzeylerinin değişip değişmediği incelenmek istenmektedir. Bu amaçla 13 kişi “yemekten 1 saat önce veya sonra çay içenler”, “yemekten 30 dakika önce ya da sonra çay içenler” ve “yemekle birlikte çay içenler” olmak üzere üç gruba ayrılmışlardır ve hemoglobin düzeyleri ölçülmüştür. Buna göre hemoglobin düzeyi çayın içilme zamanına göre değişmekte midir? Hipotezler: H0: Kitle dağılımları benzerdir. Ha: En az bir kitle dağılımı diğerlerinden farklıdır.
Sıra 9 6.5 1 10 5 4 13 8 3 11 2 12 Ri 55 26 Grup I II III 13.5 12.9 10.9 13.8 12.5 11.5 15.5 13 11.2 14 11 14.7 KW(5,4,4;0.05)=5.657<KW=10.68 p<0.05, H0 red. I: Yemekten 1 saat önce veya sonra çay içenler II: Yemekten 30 dakika önce ya da sonra çay içenler III: Yemekle birlikte çay içenler
Çoklu Karşılaştırma Tablosu Gruplar İstatistiksel Karar 1-2 4.5 2.115 p<0.05 1-3 8.5 2-3 4 2.229
rxc Ki-KareTesti Ki-kare testi iki ya da daha fazla gruplarda oran ya da frekansları karşılaştırmak için de kullanılır. Çok gözlü ki-kare düzenleri çoğu zaman satır ve sütun sayıları yardımıyla adlandırılır. Eğer incelenen herhangi bir nitelik değişken bakımından 2’den çok grup arasında fark olup olmadığı araştırılıyor ise bağımsız değişkenin(grupların) satırlarda yer alması,gerektiğinde yapılacak bazı ileri hesaplamalar içim daha uygun olacaktır.
İkinci Ölçüt Birinci Ölçüt 1 2 c Toplam G11 G12 G1c G1. G21 G22 G2c G2. r Gr1 Gr2 Grc Gr. G.1 G.2 G.c N
sd = (r-1)(c-1) Çok gözlü ki-kare düzenlerinde beklenen frekansı 5’ten küçük göz sayısının toplam göz sayısı içinde payının %20’yi aşmaması istenir.
Bitirme puanı ile meslekteki başarı arasında bir ilişki var mıdır? Örnek: Beslenme ve diyetetik bölümünü <75, 75-84 ve 85+ not ortalaması ile bitiren öğrencilerin meslekteki başarı durumları inceleniyor. Sonuçlar; Meslekteki Başarı Bitirme Puanı Başarılı Yeterli Başarısız Toplam 85+ 50 30 25 105 75-84 35 80 140 <75 90 165 110 200 100 410 Bitirme puanı ile meslekteki başarı arasında bir ilişki var mıdır?
Hiçbir hücrenin beklenen değeri 5’ten küçük değildir. Meslekteki Başarı Bitirme Puanı Başarılı Yeterli Başarısız Toplam 85+ 50 (28.2) 30 (51.2) 25 (25.6) 105 75-84 35 (37.6) 80 (68.3) 25 (34.1) 140 <75 25 (44.3) 90 (80.5) 50 (40.2) 165 110 200 100 410 Hiçbir hücrenin beklenen değeri 5’ten küçük değildir.
H0: Bitirme puanı ve meslekteki başarı bağımsızdır. Ha: Bitirme puanı ve meslekteki başarı bağımsız değildir. 2hesap =42.22 > 2(4,0.05)=9.488, H0 red , p<0.05 Bitirme puanı ile meslekteki başarı arasında bir ilişki vardır.
Farklılığın hangi gruplardan kaynakladığını bulmak için her bir grup için ayrı ayrı ki-kare değerleri hesaplanır. Meslekteki Başarı Bitirme Puanı Başarılı Yeterli Başarısız Toplam 85+ 50 (28.2) 30 (51.2) 25 (25.6) 105 75-84 35 (37.6) 80 (68.3) 25 (34.1) 140 <75 25 (44.3) 90 (80.5) 50 (40.2) 165 110 200 100 410 2=25.66 2=4.63 2=11.93 2=42.22 Farklılığın hangi gruplar arasında olduğunu bulmak için ki-kare değeri büyük olan grup (85+) dışarıda bırakılır. Geriye kalan gruplar arasında fark olup olmadığı yeniden ki-kare analizi yapılarak araştırılır. Buna göre ki-kare değeri 8.60 olarak bulunur. (2-1)x(3-1)=2 Serbestlik dereceli ki-kare tablo istatistiği 5.99 olarak elde edilir ve 2hesap =8.60> 2tablo=5.99 olduğu için Ho hipotezi red edilir. Yani 75-84 ve <75 puan grupları ile meslekteki başarı arasında anlamlı bir ilişki vardır. Genel bir yorum olarak, tüm bitirme puanları ile meslekteki başarı arasında anlamlı bir ilişki vardır.
BAĞIMLI GRUPLARA İLİŞKİN HİPOTEZ TESTLERİ
BAĞIMLI K ÖRNEKLEM TESTLERİ PARAMETRİK OLMAYAN TESTLER İKİ ÖRNEKLEM TESTLERİ BAĞIMLI K ÖRNEKLEM TESTLERİ PARAMETRİK TESTLER PARAMETRİK OLMAYAN TESTLER TEKRARLI ÖLÇÜMLERDE TEK YÖNLÜ VARYANS ANALİZİ FRIEDMAN TESTİ COCHRAN Q TESTİ
TEK YÖNLÜ VARYANS ANALİZİ TEKRARLI ÖLÇÜMLERDE TEK YÖNLÜ VARYANS ANALİZİ İki eş arasındaki farkın önemlilik testinin ikiden çok grup için genelleştirilmişidir Örnek 1. Kandaki şeker miktarını düşürmek için hazırlanan bir diyet programının etkinliğini ölçmek için şeker hastalarının diyetten önce, diyetin 1. ayında ve diyetin 3. ayında kandaki şeker miktarlarının farklı olup olmadığının araştırılmasında kullanılabilir.
Örnek 2. Üç ayrı firmanın ürettiği tansiyon ölçme araçlarının aynı kişilerin tansiyonunu aynı değerde ölçüp ölçmediğinin test edilmesinde kullanılabilir.
Zaman Gözlem 1 j k Ortalama 1 x11 x1j x1k i xi1 xij xik n Ortalama
ÖRNEK: BKİ>35 olan 30 bireye mide bandı takılmıştır. Bant takılmadan önce, takıldıktan 3 ay sonra ve takıldıktan 6 ay sonra beden kitle indeksleri ölçülmüştür. Beden kitle indeksleri zamana göre değişmekte midir?
Beden Kitle İndeksi Birey Bant Öncesi Banttan 3 ay sonra 1 40,45 30,04 25,23 2 42,96 27,34 30,46 3 42,44 31,83 25,90 4 49,10 41,86 38,45 5 48,50 44,60 36,80 6 50,90 42,73 40,78 7 53,21 43,17 42,05 8 46,90 40,29 37,65 9 51,37 46,06 41,81 . 30 43,43 39,09 36,75
Tanımlayıcı İstatistikler Zaman Ortalama S. Sapma n Bant Öncesi 47,71 5,08 30 Banttan 3 ay sonra 40,26 5,83 Banttan 6 ay sonra 36,52 6,16 25
BKİ>35 olan bireylerin zamana göre Beden Kitle İndekslerine ilişkin ortalama ve standart sapma grafiği
HİPOTEZLERİN BELİRLENMESİ H0: Mide bandı takılmadan önceki ve takıldıktan sonraki zamanlarda BKİ değerleri bakımından fark yoktur. H1: Mide bandı takılmadan önceki ve takıldıktan sonraki zamanlarda BKİ değerleri bakımından fark vardır. Karşılaştırma için F dağılımından yararlanılır. Hesapla bulunan F istatistiğinin elde edilmesinde kullanılan bilgiler sıklıkla varyans analizi tablosunda özetlenir.
BKİ için Varyans Analizi Tablosu Değişim Kaynağı KT Sd KO F P Genel 4544,86 89 ZamanlarArası 1847,03 2 923,52 165,80 0.000 Denekler Arası 2374,85 29 81,89 Hata 322,98 58 5,57 BKİ’nin zamanlara göre değişimi önemlidir (p<0.05). Hangi zamanlar arasında fark olduğu ikişerli karşılaştırmalarla incelenmelidir.
Tukey HSD testi ile ikişerli karşılaştırmalara bakılacak olursa; P<0.05 GISD: Grup içi serbestlik derecesi
q değerleri tablosu
Çoklu Karşılaştırma Tablosu Gruplar İstatistiksel Karar 1-2 7.44 2.07 p<0.05 1-3 10.85 2-3 3.41
FRIEDMAN TESTİ Tekrarlı ölçümlerde varyans analizinin varsayımları yerine gelmediğinde (özellikle denek sayısı az ve/ya da veriler sayımla belirtildiğinde ya da sıralama ölçeğinde olduğu durumlarda) kullanılır.
Friedman testi için test istatistiği: n: Satır sayısı k: Grup (sütun sayısı) Rj: Her bir gruba (sütuna) ilişkin sıra numaraları toplamı
İstatistiksel karar için ki-kare ya da F dağılımından yararlanılabilir (F dağılımından yararlanılarak yapılan çözüme burada değinilmeyecektir). İstatistiği seçilen yanılma düzeyinde k-1 serbestlik dereceli ki-kare dağılımı gösterir. Gruplar arasında fark olması durumunda ikişerli karşılaştırmalar yapılır.
Örnek : Tekrarlı ölçümlerde tek yönlü varyans analizi için verilen örneğin 11 birey üzerinde yapıldığını düşünelim. Bu durumda Friedman testi için hazırlık tablosu aşağıdaki gibi olacaktır.
Birey Bant Öncesi Banttan 3 ay sonra Banttan 6 ay sonra R(1) Sıra no 40,45 30,04 25,23 3 2 42,96 27,34 30,46 42,44 31,83 25,90 4 49,10 41,86 38,45 5 48,50 44,60 36,80 6 50,90 42,73 40,78 7 53,21 43,17 42,05 8 46,90 40,29 37,65 9 51,37 46,06 41,81 10 52,44 39,59 25,37 11 45,67 39,60 35,84
Friedman test istatistiği: Örneğimiz için hipotez: Ho: BKİ zamana göre değişmemiştir. Friedman test istatistiği: =20.18 Ho red =5.99
COCHRAN Q TESTİ Cochran Q testi, McNemar bağımlı örneklerde ki-kare testinin ikiden çok grup için genelleştirilmişidir. Cochran Q testinde incelenen değişken, evet-hayır, yeterli-yetersiz… gibi iki durumludur.
Cochran Q istatistiği: Cj: sütun toplamları Ri: satır toplamları n: gözlem sayısı k: grup sayısı
İstatistiksel karar: Hesapla bulunan Q istatistiği seçilen alfa yanılma düzeyinde k-1 serbestlik dereceli ki-kare tablo istatistiği ile karşılaştırılır. QHESAP > QTABLO ise Ho Hipotezi reddedilir.
Örnek: Beslenme ve diyetetik öğrencilerinin geleceğe yönelik kaygılarının yıllar içinde değişip değişmediğini incelemek amacıyla düzenlenen ve aynı öğrenciler üzerinde son 3 öğretim yılı süresince devam eden bir çalışmada öğrencilere geleceğe yönelik kaygılarının var olup olmadığı soruluyor ve yanıtlar; geleceğe yönelik kaygı var için 1, yok için 0 şeklinde kodlanıyor. Öğrencilerin geleceğe yönelik kaygılarının yıllar içinde değişip değişmediği Cochran Q testi ile araştırılabilir.
Öğrenci Dönem II III IV Ri 1 2 3 4 5 6 7 8 9 10 Cj 18 QHESAP= 9 > 2(2,0.05) =5.99 p<0.05 H0 reddedilir. Fark önemli olduğu için ikişerli karşılaştırmalar McNemar testi ile yapılabilir.
Kİ-KARE TABLOSU