3. Hafta İstatistik
Varyans Analizi: Ortalamalar Arası Farkların Test Edilmesi İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden fazla örnek ortalamasını birlikte test etmek ve aralarındaki farkın önem kontrolünü yapmak mümkün değildir. İki veya daha fazla örnek ortalaması arasındaki farkın önemli olup olmadığını test ederken varyans analizine başvurulur.
Tek Yönlü Varyans Analizi (ANOVA) Tek yönlü varyans analizi, iki ya da daha fazla ortalamanın eşitliğini, varyansları kullanarak test etmeye yarayan bir yöntemdir. Tamamen rassal deney tasarımı modellerini analiz etmekte kullanılır. Varsayımları: Örneklerin elde edildiği populasyonlar normal ya da yaklaşık olarak normal dağılış gösterir. Örnekler bağımsızdır. Populasyon varyansları eşittir.
TEK YÖNLÜ VARYANS ANALİZİ k adet anakütleden n hacimli bağımsız tesadüfi örnekler seçildiğinde, bu örneklerin ortalamalarından hareketle anakütle ortalamalarının birbirinden farklı olup olmadığı test edilebilir. Öncelikle k adet anakütleyi belirli kriterlere göre farklı işlem gruplarına ayırmak gerekir. Bu sınıflama şeklinde, veriler farklı işlem gruplarına ayrılırken işlem grubu içersindeki veriler birbirinden bağımsız olur. Tek yönlü sınıflama durumunda veriler aşağıdaki gibi gösterilir.
İşlemler 1 2 … i … k X11 X21 … Xi1 … Xk1 X12 X22 … Xi2 … Xk2 . X1n X2n … Xin … Xkn Toplam T1 T2 Ti Tk T Ortalama Test Hipotezleri Kurulabilecek sıfır hipotezi ve alternatif hipotez aşağıdaki gibi olur.
Hipotezler H0: 1 = 2 = 3 = ... = c H1: Tüm j ler eşit değildir. X Tüm populasyon ortalamaları eşittir. (Tedavi etkisi yoktur.) H1: Tüm j ler eşit değildir. Populasyonlardan en az birinin ortalaması diğerlerininkinden farklıdır. (Tedavi etkisi vardır.) X f(X) 1 = 2 3 X f(X) 1 = 2 3
Test İstatistiği: Varyans analizinde temel amaç, ikiden fazla örnek için ‘lerin genel ortalama ’dan sapmalarının kareler toplamını, bu sapmalara sebep olan unsurlar itibariyle kısımlara ayırmak ve analiz etmektir. Bu analiz sonunda, örnekler arasında uygunluk olup olmadığı yani söz konusu örneklerin aynı anakütleye ait birer şans örneği olup olmadıkları da ortaya konulmuş olur. değerinin, yani örneklerdeki bütün değerlerinin genel ortalamadan gösterdikleri sapmaların kareler toplamının iki kaynağı vardır:
Gruplar arası değişkenlik Gruplar içi değişkenlik Toplam Değişkenliğin Sebepleri Toplam Değişkenlik Gruplar arası değişkenlik Gruplar içi değişkenlik
GİKT GKT GAKT Eşitliğin sol tarafındaki ifadeye genel kareler toplamı (GKT) denir. Eşitliğin sağ kısmındaki ifadelerin birincisi örnek ortalamalarının genel ortalamadan gösterdiği sapmalar, diğeri ise her bir örnekteki değerlerin kendi örnek ortalamalarından gösterdiği sapmalardır. Birincisine, gruplar arası kareler toplamı ( GAKT ), ikincisine grup içi kareler toplamı ( GİKT ) denir. Eşit örnekler durumunda
Eşit örnek hacimleri durumunda varyans analizi tablosu; Gruplar arası kareler ortalaması s12 , gruplar içi kareler ortalaması s22 bölünerek varyans analizinin test istatistiği olan F değeri elde edilir. Eşit örnek hacimleri durumunda varyans analizi tablosu; Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması Test İstatistiği İşlem GAKT v1=k-1 Hata GİKT v2= k(n-1) Toplam GKT n(k)-1 k:örnek sayısı N:örnek büyüklüğü
Eşit olmayan örnekler durumunda, toplam gözlem sayısı N ile gösterilirse; Bu eşitliklerdeki üç varyasyon kaynağının her biri uygun bir serbestlik derecesi ile bölünerek birer varyans elde edilir. Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması Test İstatistiği işlem GAKT v1=k-1 Hata GİKT v2= N-k Toplam GKT N-1
KRİTİK DEĞER Çeşitli önem seviyeleri ve örnek büyüklükleri için s12 / s22 nin hangi noktaya kadar şansa verilebileceği, hangi noktadan sonra önemli kabul edilerek örneklerin farklı anakütlelere ait olduklarına hükmedilebileceği F cetvelleriyle tespit edilmiştir. Hesaplanan F değeri, F tablosundan elde edilen kritik değerden küçükse örnek ortalamaları arasındaki farklılık tesadüfi; yani şanstan ileri gelmiştir ve örnekler aynı anakütleye aittir.
Hesaplanan test istatistiği , kritik değerden büyükse örnek ortalamaları arasındaki farklılığın önemli olduğuna hükmedilir ve bu örneklerin farklı anakütlelere ait olduklarına karar verilir. F değeri, iki varyansın birbirine bölümü olduğu için negatif değer almaz. Bu yüzden F dağılımı sağa çarpıktır. H0 hipotezinin red bölgesi eğrinin sağ ucunda yer alır.
ÖRNEK 1: Bir üretimden n=5 büyüklüğündeki k = 4 örnekten aşağıdaki sonuçlar elde edilmiştir. % 5 önem seviyesine göre örnek ortalamaları arasındaki farkın önemli olup olmadığını ; bir başka deyişle, üretimin kontrol altında olup olmadığını varyans analizi ile kontrol ediniz. I II III IV 1 10 11 16 12 2 13 3 15 14 4 9 5 Ti 55 50 75 60 Ti2 3025 2500 5625 3600 k=4 n=5 T=240 T2=57600
Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması Test İstatistiği işlem (GAKT) 70 v1=4-1 Hata (GİKT) 22 v2= 4(5-1) Toplam (GKT) 92 5(4)-1 önem seviyesi , v1 =3 ve v2 = 16 sd. göre Ftab= 3.24 Test istatistiği , kritik değerden ( Ftab= 3.24) büyük olduğu için % 5 önem seviyesinde H0 hipotezini reddederek en az iki örnek ortalamasının birbirinden farklı olduğuna karar verilir. Bu durum üretimin kontrol altında olmadığı kanaatini uyandırır.
ÖRNEK 2: Üç pil fabrikasında üretilen pillerin ortalama ömrünü mukayese etmek isteyen bir araştırmacı aşağıdaki verileri elde etmiştir. Bu verilere göre pillerin ortalama ömürleri arasında önemli bir farklılığın olup olmadığını % 1 önem seviyesinde test ediniz. I II III 222 226 220 224 228 221 227 Ti 1125 909 1329 k=3 N=15 T=3363 T2 =11309769
Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması Test İstatistiği işlem (GAKT) 84.15 v1=3-1 Hata 30.25 v2= 15-3 Toplam 114.40 15-1 önem seviyesi , v1 =2 ve v2 = 12 sd. göre Ftab= 6.93 Test istatistiği , kritik değerden ( Ftab= 6.93) büyük olduğu için % 1 önem seviyesinde H0 hipotezini red ederek en az iki örnek ortalamasının birbirinden farklı olduğuna karar verilir. En az iki fabrikada üretilen pillerin ortalama dayanma süreleri birbirine eşit değildir.
Kİ-KARE TESTİ (CHI-SQUARE TEST) Gözlenen ve beklenen frekanslar arasındaki farkın anlamlı olup olmadığı temeline dayanır. Niteliksel olarak belirtilen verilerin analizinde kullanılır.
Hangi durumlarda kullanılır? İki yada daha çok grup arasında fark olup olmadığının testinde, İki değişken arasında bağ olup olmadığının testinde, Gruplar arası homojenlik testinde, Örneklemden elde edilen dağılımın istenen herhangi bir teorik dağılıma uyup uymadığının testinde (uyum iyiliği testi) kullanılır.
UYGULANDIĞI DÜZENLER DÖRT GÖZLÜ DÜZENLER (2X2 TABLOLAR) Akciğer kanseri Sigara içme Var Yok İçen 20 80 İçmeyen 5 95
ÇOK GÖZLÜ DÜZENLER (2xm, nx2, nxm tablolar) 2x3 düzen Başarı durumu Beslenme İyi Orta Zayıf Yeterli 60 30 10 Yetersiz 40 4x3 düzen İyileşme durumu Tedavi yöntemi İyi Orta Az A 50 30 20 B 10 60 C 25 D 90 5
VARSAYIMLARI Gruplar birbirinden bağımsız olmalıdır. Beklenen değer 5 ‘den büyük olmalıdır. 2x2 düzenlerde beklene değer 5’den küçükse Denek sayısını arttırılmalıdır, Satırlar yada sütunlar birleştirilmelidir, Devamlılık düzeltmeli ki-kare testi (Continuity Correction) kullanılmalıdır. Bu Yates düzeltmesi olarak da anılır. Fisher’s kesin ki-kare (Fisher’s exact test) uygulanır.
3. 2xm, mx2 ve nxm tablolarda 1. Denek sayısı arttırılmalı, 2. Satır yada sütunlar birleştirilmelidir.
ÖRNEK Sigara içenlerle içmeyenler arasında akciğer kanseri görülme oranlarının farklı olup olmadığı araştırılmak istenmektedir. Çalışma sonuçları aşağıdaki gibidir. Akciğer kanseri Sigara içme Var Yok Toplam İçen 20 80 100 İçmeyen 5 95 25 175 200 H0: Sigara içen ve içmeyenlerde akciğer kanseri görülme oranları arasında fark yoktur. H1: Sigara içen ve içmeyenlerde akciğer kanseri görülme oranları arasında fark vardır.
Adımlar Beklenen frekanslar bulunur. Akciğer kanseri Sigara içme Var Beklenen değer: (25/200)*100 = 12,5 Beklenen değer: (175/200)*100 = 87,5 Akciğer kanseri Sigara içme Var Yok Toplam İçen 20 80 100 İçmeyen 5 95 25 175 200 Beklenen değer: (25/200)*100 = 12,5 Beklenen değer: (175/200)*100 = 87,5
Ki-kare test istatistiği
BAĞIMLI GRUPLARDA Kİ-KARE TESTİ (MC-NEMAR TESTİ) Nitelik olarak belirtilen bir değişken yönünden aynı bireylerden değişik zaman ya da durumda elde edilen iki gözlemin farklı olup olmadığını test etmek için kullanılır. Bu testte dikkat edilmesi gereken noktalar şunlardır: Aynı bireyler üzerinde iki gözlem yapılmaktadır. Bu nedenle gruplar bağımsız değildir. Bu gruplar arasında farklı olup olmadığı test edilen değişken sayımla belirtilen nitel bir karakterdir. (var-yok, iyileşti-iyileşmedi, hasta-sağlam) Bu test sadece 4 gözlü düzenlerde uygulanabilir.
Testin kullanıldığı durumlara aşağıdaki örnekler verilebilir: Aile planlaması konusunda eğitimden önce ve sonra aynı kadınların bilgi düzeylerini yeterli ve yetersiz biçiminde nitelendirip; eğitimden önceki ve eğitimden sonraki bilgi düzeyleri arasında fark olup olmadığını araştırmak için kullanılır. Eğitimden Sonra Eğitimden Önce Yeterli Yetersiz a b c d Aynı bireyleri muayene eden iki göz hastalıkları hekiminin görme kusuru bulgularının farklı olup olmadığını karşılaştırmak için kullanılır. Doktor B Doktor A Var Yok a b c d
Testin kullanıldığı durumlara aşağıdaki örnekler verilebilir: 2001 Parazit 2002 Parazit Var Yok a b c d
Bu teste ilişkin 2 değeri aşağıdaki gibidir: 2 tablo değeri, serbestlik derecesi = (Satır sayısı – 1)(Kolon sayısı - 1) = (2-1)(2-1)=1 ve =0.05 yanılma düzeyindeki 3.841 değeridir. > olduğu durumda yokluk hipotezi reddedilir.
ÖRNEK: Aile planlaması konusunda eğitimden önce ve sonra aynı kadınların bilgi düzeylerini yeterli ve yetersiz biçiminde nitelendirip; eğitimden önceki ve eğitimden sonraki bilgi düzeyleri arasında fark olup olmadığını araştırmak için bir çalışma yapılmış; aşağıdaki sonuçlar elde edilmiştir. Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık var mıdır? H0: Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık yoktur. H1: Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık vardır.
olduğu durumda yokluk hipotezi reddedilir. 2 tablo değeri, serbestlik derecesi = (Satır sayısı – 1)(Kolon sayısı - 1) = (2-1)(2-1)=1 ve =0.05 yanılma düzeyindeki 3.841 değeridir. > olduğu durumda yokluk hipotezi reddedilir. Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık vardır.
MANN - WHITNEY U TESTİ İki ortalama arasındaki farkın önemlilik testinin parametrik olmayan karşılığı Parametrik test varsayımları yerine getirilmeden iki ortalama arasındaki farkın önemlilik testinin uygulanması varılan kararın hatalı olmasına neden olur Bu durumda Mann Whitney U testi yapılır
Veri parametrik test varsayımlarını yerine getiremiyor ise İki Ortalama Arasındaki Farkın Önemlilik Testi yerine kullanılabilecek en güçlü test MANN-WHITNEY U TESTİ’dir.
Sıralı ve Kesikli Değişkenlerde Mann Whitney U Bağımsız 2 grup varlığında ve Sıralı ve kesikli değişkenlerin karşılaştırılmasında kullanımı uygundur
Varsayımları Bağımlı değişken sıralı ve ya kesiklidir Bağımsız değişken iki kategori, grup olmalı Gruplar bağımsız olmalı Gözlemler bağımsız olmalı
Normal dağılım
ÖRNEKLER Bir önceki örneklerde veri parametrik test koşullarını sağlamadığında, Sigara içen içmeyen annelerin çocuklarının apgar skorları arasında fark olup olmadığının araştırılmasında, Kömür madeni ocağında çalışanlar ile aynı bölgede masa başında çalışanların akciğerlerindeki leke sayıları arasında fark olup olmadığının incelenmesinde, Spor yapan ve yapmayan öğrencilerin bir dakika içindeki şınav sayıları arasında fark olup olmadığının araştırılmasında.
ÖRNEKLER Örnek 1: Kandaki şeker miktarı yönünden bağımsız iki grup (örneğin; diyet uygulayanlarla uygulamayanlar, babası ya da annesi şeker hastası olanlarla olmayanlar, ... gibi) arasında farklılık arandığında kullanılır. Örnek 2: Bulaşıcı hastalıklar bilgi puanı yönünden bağımsız iki grup (erkeklerle kadınlar, eğitim düzeyi yüksek olanlarla düşük olanlar, köysel bölgede oturanlarla kentsel bölgede oturanlar, ... gibi) arasında farklılık arandığında kullanılır.
Wilcoxon İşaretli Sıralar Testi Bağımlı (eşli) örneklem t- testinin parametrik olmayan karşılığıdır. İki değişkene ait verilerin normal dağılması gerekmez. Veriler sıralama ölçme düzeyinde toplanmış olmalı ya da aralıklı/oranlı veriler sıralama verisine çevrilmelidir (çevirme işlemini test seçildiğinde PASW yapıyor) Okuma ve yazma puanlarının normal dağılmadığını daha önce K-S testiyle test ettiğimize göre, aynı örneği kullanarak öğrencilerin okuma ve yazma puanları arasında fark olup olmadığını test edelim. Araştırma denencesi (H1): “Öğrencilerin okuma ve yazma puanları birbirinden farklıdır.” (çift kuyruk testi).
Wilcoxon İşaretli Sıralar Testi Varsayımlar 1. Karşılaştırılacak iki örneklem bağımlıdır. 2. Bağımlı değişken en az sıralamalı ölçek düzeyindedir. Hipotezler H 0: Öntest ile Sontest puanları arasında fark yok. H1: Öntest ile Sontest puanları arasında fark var (Çift yönlü) H1: Sontest puanları öntest puanlarından daha yüksek (Tek yönlü)
Wilcoxon İşaretli Sıralar Testi n > 20 için Normal Dağılış Yaklaşımı Kullanılır.
Wilcoxon İşaretli Sıralar Testi
Kruskal Wallis-H Testi Normal dağılım göstermeyen gruplarda üç veya daha fazla sayıda grubun ortalamaları arasındaki farklılığın anlamlılığını test amacıyla kullanılan bir tekniktir. One-Way ANOVA’nın non-parametrik karşılığıdır.
Kruskal Wallis-H Testi Örnek Soru: Otokontrol puanları algılanan sosyoekonomik düzey değişkenine göre farklılaşmakta mıdır? Hipotezler: H0: Gelir grupların ortalamaları arasındaki fark anlamlı değildir. H1: En az iki grup ortalaması arasındaki fark istatistiksel olarak anlamlıdır.
Adım Adım Örnek Veriler: Veriler sürekli değişken cinsinden (eşit aralıklı veya eşit oranlı) ham puanlardır ve öncelikle bu veriler gruplara göre ayrılır. Ardından N bütün olarak kabul edilerek en küçük değerden büyük değere doğru sıra numaraları verilir. Alt grup sayılarının eşit olması gerekmemektedir.
Bu işlemin ardından anlamlılık için kritik değeri belirlemek amacıyla Serbestlik derecesine ihtiyaç duyulur. Kruskal Wallis tekniğinde serbestlik derecesi “kategori sayısı – 1” formülü ile hesaplanır [Sd= 3-1→sd=2]. Anlamlılığına karar vermek için ki-kare (Chi-Square/c2) değeri anlamlılık tablosu kullanılır
H değeri (H=6,12) ki-kare .05 düzeyi için sınır değer olan (c2=5,991) büyük olduğundan sonuç anlamlı kabul edilir. Yani Otokontrol puanları algılanan sosyoekonomik düzey grupları arasında p<.05 düzeyinde anlamlı bir farklılık göstermektedir. Öte yandan 6,12>9,210 olduğundan belirlenen farklılık .01 düzeyinde anlamlı bulunmamıştır. Sonuç olarak .05 düzeyi için H0 reddedilir; H1 kabul edilir (p<.05); .01 düzeyi için H1 reddedilir; H0 kabul edilir (p>.01);