Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

3. Hafta İstatistik 1. Varyans Analizi: Ortalamalar Arası Farkların Test Edilmesi İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne.

Benzer bir sunumlar


... konulu sunumlar: "3. Hafta İstatistik 1. Varyans Analizi: Ortalamalar Arası Farkların Test Edilmesi İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne."— Sunum transkripti:

1 3. Hafta İstatistik 1

2 Varyans Analizi: Ortalamalar Arası Farkların Test Edilmesi İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden fazla örnek ortalamasını birlikte test etmek ve aralarındaki farkın önem kontrolünü yapmak mümkün değildir. İki veya daha fazla örnek ortalaması arasındaki farkın önemli olup olmadığını test ederken varyans analizine başvurulur. 2

3 Tek Yönlü Varyans Analizi (ANOVA) Tek yönlü varyans analizi, iki ya da daha fazla ortalamanın eşitliğini, varyansları kullanarak test etmeye yarayan bir yöntemdir. Tamamen rassal deney tasarımı modellerini analiz etmekte kullanılır. Varsayımları: Örneklerin elde edildiği populasyonlar normal ya da yaklaşık olarak normal dağılış gösterir. Örnekler bağımsızdır. Populasyon varyansları eşittir. 3

4 TEK YÖNLÜ VARYANS ANALİZİ k adet anakütleden n hacimli bağımsız tesadüfi örnekler seçildiğinde, bu örneklerin ortalamalarından hareketle anakütle ortalamalarının birbirinden farklı olup olmadığı test edilebilir. Öncelikle k adet anakütleyi belirli kriterlere göre farklı işlem gruplarına ayırmak gerekir. Bu sınıflama şeklinde, veriler farklı işlem gruplarına ayrılırken işlem grubu içersindeki veriler birbirinden bağımsız olur. Tek yönlü sınıflama durumunda veriler aşağıdaki gibi gösterilir. 4

5 İşlemler 1 2 … i … k X 11 X 21 … X i1 … X k1 X 12 X 22 … X i2 … X k2. X 1n X 2n … X in … X kn Toplam T 1 T 2 T i T k T Ortalama Test Hipotezleri Kurulabilecek sıfır hipotezi ve alternatif hipotez aşağıdaki gibi olur. 5

6 Hipotezler H 0 :  1 =  2 =  3 =... =  c –Tüm populasyon ortalamaları eşittir. (Tedavi etkisi yoktur.) H 1 : Tüm  j ler eşit değildir. –Populasyonlardan en az birinin ortalaması diğerlerininkinden farklıdır. (Tedavi etkisi vardır.) X f(X)f(X)  1 =  2 =  3 X f(X)f(X)  1 =  2  3 6

7 Test İstatistiği: Varyans analizinde temel amaç, ikiden fazla örnek için ‘lerin genel ortalama’dan sapmalarının kareler toplamını, bu sapmalara sebep olan unsurlar itibariyle kısımlara ayırmak ve analiz etmektir. Bu analiz sonunda, örnekler arasında uygunluk olup olmadığı yani söz konusu örneklerin aynı anakütleye ait birer şans örneği olup olmadıkları da ortaya konulmuş olur. değerinin, yani örneklerdeki bütündeğerlerinin genel ortalamadan gösterdikleri sapmaların kareler toplamının iki kaynağı vardır: 7

8 Toplam Değişkenliğin Sebepleri Gruplar arası değişkenlik Gruplar içi değişkenlik Toplam Değişkenlik 8

9 Eşitliğin sol tarafındaki ifadeye genel kareler toplamı (GKT) denir. Eşitliğin sağ kısmındaki ifadelerin birincisi örnek ortalamalarının genel ortalamadan gösterdiği sapmalar, diğeri ise her bir örnekteki değerlerin kendi örnek ortalamalarından gösterdiği sapmalardır. Birincisine, gruplar arası kareler toplamı ( GAKT ), ikincisine grup içi kareler toplamı ( GİKT ) denir. Eşit örnekler durumunda GKTGAKT GİKT 9

10 Gruplar arası kareler ortalaması s 1 2, gruplar içi kareler ortalaması s 2 2 bölünerek varyans analizinin test istatistiği olan F değeri elde edilir. Eşit örnek hacimleri durumunda varyans analizi tablosu; Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması Test İstatistiği İşlemGAKTv 1 =k-1 HataGİKTv 2 = k(n-1) ToplamGKTn(k)-1 k:örnek sayısı N:örnek büyüklüğü 10

11 Eşit olmayan örnekler durumunda, toplam gözlem sayısı N ile gösterilirse; Bu eşitliklerdeki üç varyasyon kaynağının her biri uygun bir serbestlik derecesi ile bölünerek birer varyans elde edilir. Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması Test İstatistiği işlemGAKTv 1 =k-1 HataGİKTv 2 = N-k ToplamGKTN-1 11

12 KRİTİK DEĞER Çeşitli önem seviyeleri ve örnek büyüklükleri için s 1 2 / s 2 2 nin hangi noktaya kadar şansa verilebileceği, hangi noktadan sonra önemli kabul edilerek örneklerin farklı anakütlelere ait olduklarına hükmedilebileceği F cetvelleriyle tespit edilmiştir. Hesaplanan F değeri, F tablosundan elde edilen kritik değerden küçükse örnek ortalamaları arasındaki farklılık tesadüfi; yani şanstan ileri gelmiştir ve örnekler aynı anakütleye aittir. 12

13 Hesaplanan test istatistiği, kritik değerden büyükse örnek ortalamaları arasındaki farklılığın önemli olduğuna hükmedilir ve bu örneklerin farklı anakütlelere ait olduklarına karar verilir. F değeri, iki varyansın birbirine bölümü olduğu için negatif değer almaz. Bu yüzden F dağılımı sağa çarpıktır. H 0 hipotezinin red bölgesi eğrinin sağ ucunda yer alır. 13

14 ÖRNEK 1: Bir üretimden n=5 büyüklüğündeki k = 4 örnekten aşağıdaki sonuçlar elde edilmiştir. % 5 önem seviyesine göre örnek ortalamaları arasındaki farkın önemli olup olmadığını ; bir başka deyişle, üretimin kontrol altında olup olmadığını varyans analizi ile kontrol ediniz. IIIIIIIV TiTi Ti2Ti T=240 T 2 =57600 k=4 n=5 14

15 15

16 Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması Test İstatistiği işlem (GAKT) 70v 1 =4-1 Hata (GİKT) 22v 2 = 4(5-1) Toplam (GKT) 925(4)-1 önem seviyesi, v 1 =3 ve v 2 = 16 sd. göre F tab = 3.24 Test istatistiği, kritik değerden ( F tab = 3.24) büyük olduğu için % 5 önem seviyesinde H 0 hipotezini reddederek en az iki örnek ortalamasının birbirinden farklı olduğuna karar verilir. Bu durum üretimin kontrol altında olmadığı kanaatini uyandırır. 16

17 ÖRNEK 2: Üç pil fabrikasında üretilen pillerin ortalama ömrünü mukayese etmek isteyen bir araştırmacı aşağıdaki verileri elde etmiştir. Bu verilere göre pillerin ortalama ömürleri arasında önemli bir farklılığın olup olmadığını % 1 önem seviyesinde test ediniz. IIIIII TiTi T=3363 T 2 = k=3 N=15 17

18 18

19 Değişim Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler OrtalamasıTest İstatistiği işlem (GAKT) 84.15v 1 =3-1 Hata30.25v 2 = 15-3 Toplam önem seviyesi, v 1 =2 ve v 2 = 12 sd. göre F tab = 6.93 Test istatistiği, kritik değerden ( F tab = 6.93) büyük olduğu için % 1 önem seviyesinde H 0 hipotezini red ederek en az iki örnek ortalamasının birbirinden farklı olduğuna karar verilir. En az iki fabrikada üretilen pillerin ortalama dayanma süreleri birbirine eşit değildir. 19

20 Kİ-KARE TESTİ (CHI-SQUARE TEST) Gözlenen ve beklenen frekanslar arasındaki farkın anlamlı olup olmadığı temeline dayanır. Niteliksel olarak belirtilen verilerin analizinde kullanılır. 20

21 Hangi durumlarda kullanılır? 1. İki yada daha çok grup arasında fark olup olmadığının testinde, 2. İki değişken arasında bağ olup olmadığının testinde, 3. Gruplar arası homojenlik testinde, 4. Örneklemden elde edilen dağılımın istenen herhangi bir teorik dağılıma uyup uymadığının testinde (uyum iyiliği testi) kullanılır.

22 UYGULANDIĞI DÜZENLER DÖRT GÖZLÜ DÜZENLER (2X2 TABLOLAR) Akciğer kanseri Sigara içmeVarYok İçen2080 İçmeyen595

23 ÇOK GÖZLÜ DÜZENLER (2xm, nx2, nxm tablolar) Başarı durumu BeslenmeİyiOrtaZayıf Yeterli Yetersiz x3 düzen İyileşme durumu Tedavi yöntemiİyiOrtaAz A B C25 50 D9055 4x3 düzen

24 VARSAYIMLARI 1. Gruplar birbirinden bağımsız olmalıdır. 2. Beklenen değer 5 ‘den büyük olmalıdır. 2x2 düzenlerde beklene değer 5’den küçükse 1. Denek sayısını arttırılmalıdır, 2. Satırlar yada sütunlar birleştirilmelidir, 3. Devamlılık düzeltmeli ki-kare testi (Continuity Correction) kullanılmalıdır. Bu Yates düzeltmesi olarak da anılır. 4. Fisher’s kesin ki-kare (Fisher’s exact test) uygulanır.

25 3. 2xm, mx2 ve nxm tablolarda 1. Denek sayısı arttırılmalı, 2. Satır yada sütunlar birleştirilmelidir.

26 ÖRNEK Sigara içenlerle içmeyenler arasında akciğer kanseri görülme oranlarının farklı olup olmadığı araştırılmak istenmektedir. Çalışma sonuçları aşağıdaki gibidir. Akciğer kanseri Sigara içmeVarYokToplam İçen İçmeyen Toplam H 0 : Sigara içen ve içmeyenlerde akciğer kanseri görülme oranları arasında fark yoktur. H 1 : Sigara içen ve içmeyenlerde akciğer kanseri görülme oranları arasında fark vardır.

27 Adımlar 1. Beklenen frekanslar bulunur. Akciğer kanseri Sigara içmeVarYokToplam İçen İçmeyen Toplam Beklenen değer: (25/200)*100 = 12,5 Beklenen değer: (175/200)*100 = 87,5 Beklenen değer: (25/200)*100 = 12,5 Beklenen değer: (175/200)*100 = 87,5

28 Ki-kare test istatistiği

29 Nitelik olarak belirtilen bir değişken yönünden aynı bireylerden değişik zaman ya da durumda elde edilen iki gözlemin farklı olup olmadığını test etmek için kullanılır. Bu testte dikkat edilmesi gereken noktalar şunlardır: Aynı bireyler üzerinde iki gözlem yapılmaktadır. Bu nedenle gruplar bağımsız değildir. Bu gruplar arasında farklı olup olmadığı test edilen değişken sayımla belirtilen nitel bir karakterdir. (var-yok, iyileşti-iyileşmedi, hasta-sağlam) Bu test sadece 4 gözlü düzenlerde uygulanabilir. BAĞIMLI GRUPLARDA Kİ-KARE TESTİ (MC- NEMAR TESTİ)

30 Aile planlaması konusunda eğitimden önce ve sonra aynı kadınların bilgi düzeylerini yeterli ve yetersiz biçiminde nitelendirip; eğitimden önceki ve eğitimden sonraki bilgi düzeyleri arasında fark olup olmadığını araştırmak için kullanılır. Eğitimden Sonra Eğitimden ÖnceYeterliYetersiz Yeterliab Yetersizcd  Aynı bireyleri muayene eden iki göz hastalıkları hekiminin görme kusuru bulgularının farklı olup olmadığını karşılaştırmak için kullanılır. Doktor B Doktor AVarYok Varab Yokcd Testin kullanıldığı durumlara aşağıdaki örnekler verilebilir:

31 2001 Parazit 2002 ParazitVarYok Varab Yokcd

32 Bu teste ilişkin  2 değeri aşağıdaki gibidir:  2 tablo değeri, serbestlik derecesi = (Satır sayısı – 1)(Kolon sayısı - 1) = (2-1)(2-1)=1 ve  =0.05 yanılma düzeyindeki değeridir. > olduğu durumda yokluk hipotezi reddedilir.

33 ÖRNEK: Aile planlaması konusunda eğitimden önce ve sonra aynı kadınların bilgi düzeylerini yeterli ve yetersiz biçiminde nitelendirip; eğitimden önceki ve eğitimden sonraki bilgi düzeyleri arasında fark olup olmadığını araştırmak için bir çalışma yapılmış; aşağıdaki sonuçlar elde edilmiştir. Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık var mıdır? H0: Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık yoktur. H1: Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık vardır.

34  2 tablo değeri, serbestlik derecesi = (Satır sayısı – 1)(Kolon sayısı - 1) = (2-1)(2-1)=1 ve  =0.05 yanılma düzeyindeki değeridir. olduğu durumda yokluk hipotezi reddedilir. Bilgi düzeyleri bakımından eğitim öncesi ve sonrası arasında farklılık vardır. >

35 MANN - WHITNEY U TESTİ İki ortalama arasındaki farkın önemlilik testinin parametrik olmayan karşılığı Parametrik test varsayımları yerine getirilmeden iki ortalama arasındaki farkın önemlilik testinin uygulanması varılan kararın hatalı olmasına neden olur Bu durumda Mann Whitney U testi yapılır

36 Veri parametrik test varsayımlarını yerine getiremiyor ise İki Ortalama Arasındaki Farkın Önemlilik Testi yerine kullanılabilecek en güçlü test MANN-WHITNEY U TESTİ’dir.

37 Sıralı ve Kesikli Değişkenlerde Mann Whitney U Bağımsız 2 grup varlığında ve Sıralı ve kesikli değişkenlerin karşılaştırılmasında kullanımı uygundur

38 Varsayımları Bağımlı değişken sıralı ve ya kesiklidir Bağımsız değişken iki kategori, grup olmalı Gruplar bağımsız olmalı Gözlemler bağımsız olmalı

39 Normal dağılım

40

41

42 ÖRNEKLER 1. Bir önceki örneklerde veri parametrik test koşullarını sağlamadığında, 2. Sigara içen içmeyen annelerin çocuklarının apgar skorları arasında fark olup olmadığının araştırılmasında, 3. Kömür madeni ocağında çalışanlar ile aynı bölgede masa başında çalışanların akciğerlerindeki leke sayıları arasında fark olup olmadığının incelenmesinde, 4. Spor yapan ve yapmayan öğrencilerin bir dakika içindeki şınav sayıları arasında fark olup olmadığının araştırılmasında.

43 ÖRNEKLER Örnek 1: Kandaki şeker miktarı yönünden bağımsız iki grup (örneğin; diyet uygulayanlarla uygulamayanlar, babası ya da annesi şeker hastası olanlarla olmayanlar,... gibi) arasında farklılık arandığında kullanılır. Örnek 2: Bulaşıcı hastalıklar bilgi puanı yönünden bağımsız iki grup (erkeklerle kadınlar, eğitim düzeyi yüksek olanlarla düşük olanlar, köysel bölgede oturanlarla kentsel bölgede oturanlar,... gibi) arasında farklılık arandığında kullanılır.

44 Wilcoxon İşaretli Sıralar Testi Bağımlı (eşli) örneklem t- testinin parametrik olmayan karşılığıdır. İki değişkene ait verilerin normal dağılması gerekmez. Veriler sıralama ölçme düzeyinde toplanmış olmalı ya da aralıklı/oranlı veriler sıralama verisine çevrilmelidir (çevirme işlemini test seçildiğinde PASW yapıyor) Okuma ve yazma puanlarının normal dağılmadığını daha önce K-S testiyle test ettiğimize göre, aynı örneği kullanarak öğrencilerin okuma ve yazma puanları arasında fark olup olmadığını test edelim. Araştırma denencesi (H 1 ): “Öğrencilerin okuma ve yazma puanları birbirinden farklıdır.” (çift kuyruk testi). 44

45 Wilcoxon İşaretli Sıralar Testi Varsayımlar 1. Karşılaştırılacak iki örneklem bağımlıdır. 2. Bağımlı değişken en az sıralamalı ölçek düzeyindedir. Hipotezler H 0: Öntest ile Sontest puanları arasında fark yok. H1: Öntest ile Sontest puanları arasında fark var (Çift yönlü) H1: Sontest puanları öntest puanlarından daha yüksek (Tek yönlü) 45

46 Wilcoxon İşaretli Sıralar Testi n > 20 için Normal Dağılış Yaklaşımı Kullanılır. 46

47 Wilcoxon İşaretli Sıralar Testi 47

48 Kruskal Wallis-H Testi Normal dağılım göstermeyen gruplarda üç veya daha fazla sayıda grubun ortalamaları arasındaki farklılığın anlamlılığını test amacıyla kullanılan bir tekniktir. One-Way ANOVA’nın non-parametrik karşılığıdır. 48

49 Kruskal Wallis-H Testi Örnek Soru: Otokontrol puanları algılanan sosyoekonomik düzey değişkenine göre farklılaşmakta mıdır? Hipotezler: H 0 : Gelir grupların ortalamaları arasındaki fark anlamlı değildir. H 1 : En az iki grup ortalaması arasındaki fark istatistiksel olarak anlamlıdır. 49

50 Adım Adım Örnek 50 Veriler: Veriler sürekli değişken cinsinden (eşit aralıklı veya eşit oranlı) ham puanlardır ve öncelikle bu veriler gruplara göre ayrılır. Ardından N bütün olarak kabul edilerek en küçük değerden büyük değere doğru sıra numaraları verilir. Alt grup sayılarının eşit olması gerekmemektedir.

51 51

52 Bu işlemin ardından anlamlılık için kritik değeri belirlemek amacıyla Serbestlik derecesine ihtiyaç duyulur. Kruskal Wallis tekniğinde serbestlik derecesi “kategori sayısı – 1” formülü ile hesaplanır [Sd= 3-1 → sd=2]. Anlamlılığına karar vermek için ki-kare (Chi-Square/c2) değeri anlamlılık tablosu kullanılır 52

53 H değeri (H=6,12) ki-kare.05 düzeyi için sınır değer olan (c2=5,991) büyük olduğundan sonuç anlamlı kabul edilir. Yani Otokontrol puanları algılanan sosyoekonomik düzey grupları arasında p 9,210 olduğundan belirlenen farklılık.01 düzeyinde anlamlı bulunmamıştır. Sonuç olarak.05 düzeyi için H 0 reddedilir; H 1 kabul edilir (p.01); 53


"3. Hafta İstatistik 1. Varyans Analizi: Ortalamalar Arası Farkların Test Edilmesi İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne." indir ppt

Benzer bir sunumlar


Google Reklamları