Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri

Benzer bir sunumlar


... konulu sunumlar: "Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri"— Sunum transkripti:

1 Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri
Funda ÖZALP Ankara Üniversitesi Biyoistatistik Anabilim Dalı

2 Neden Kullanıyoruz? Varyans analizi,her biri normal dağılıma sahip olan birbirinden bağımsız ikiden fazla grup ortalamasını karşılaştırmak amacıyla kullanılır. k: Grup sayısı ni: i.gruptaki denek sayısı

3 Nasıl Uyguluyoruz? şeklinde hesaplanan test istatistiği (k-1) ve (n-k)
serbestlik dereceli F dağılımı gösterir.

4 Varsayımları Nelerdir?
ni hacimli örneklemlerin her biri normal dağılım göstermektedir. Örneklemler rastgele olarak seçilmiştir ve bağımsızdır. ni hacimli örneklemlerin varyansları homojendir.

5 Varsayımlar Bozulursa?
Genel olarak üç çözüm yolu önerilmektedir: Verileri, dönüşüm yoluyla varyans analizi tekniğine uygun hale getirmek Uygun bir parametrik olmayan test ile analiz etmek Varyans analizi tekniği yerine alternatif parametrik testleri kullanmaktır.

6 Alternatif Testler Nelerdir?
Welch Testi Değiştirilmiş (Modified) Welch Testi Brown-Forsythe Testi Değiştirilmiş (Modified) Brown-Forsythe Testi Yaklaşık (Approximate) Anova F Testi Cochran Testi Marascuilo Testi Scott-Smith Testi Bu test istatistiklerinin bazılarının dağılımı tam olarak bilinirken,bazılarının dağılımı simülasyon yardımıyla yaklaşık olarak bulunur. Normal dağılım ve varyans homojenliği varsayımlarından biri veya ikisi birden bozulduğunda kullanılabilir.

7 Welch Testi (Welch,1951) Test istatistiği; şeklindedir.
W>F(k-1,f;1-α) ise ortalamaların eşitliği hipotezi(H0) reddedilir. Homojen varyans varsayımı sağlanmadığında ilk olarak normal dağılıma sahip iki kitle ortalamasının eşitliğine ait hipotez testi incelenmiştir.Bu durum Behrens-Fisher problemi olarak da bilinir.Bunun için önerilen ilk testlerden biri Welch’tir(1947).Welch 1951’de k kitle ortalaması için testi genelleştirmiştir.

8 Düzeltilmiş Welch Testi (Hartung et al.,2001)
Test istatistiği; şeklindedir. Welch,kitle sayısı çok ve örneklem genişlikleri küçük olduğunda “liberal” hale gelir,yani H0’ı reddetmek daha kolaylaşır.Bu yüzden düzeltilmiş Welch testi önerilmiştir.

9 Düzeltilmiş Welch Testi (Hartung et al.,2001)
W*, yaklaşık olarak (K-1) ve vw* serbestlik dereceli olan F dağılımı gösterir. W*>F(K-1,vw*;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir.

10 Brown-Forsythe Testi (Brown&Forsythe,1974)
Test istatistiği; şeklindedir. Bu istatistiğin, serbestlik dereceleri (k-1) ve v olan F dağılımı gösterdiği varsayılır. Literatürde Welch testinden sonra en sık karşılaşılan testtir.

11 Brown-Forsythe Testi (Brown&Forsythe,1974)
BF >F(k-1,v;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. Klasik F testinin uyarlaması olan bir testtir.

12 Düzeltilmiş Brown-Forsythe Testi (Rubin,1983&Mehrotra,1997)
Rubin ve Mehrotra,Brown-Forsythe testinde pay serbestlik derecesinde bir eksikliği incelediler. Brown-Forsythe pay serbestlik derecesi olarak (k-1) kullanırken,Rubin ve Mehrotra v1 serbestlik derecesini önermişlerdir.

13 Düzeltilmiş Brown-Forsythe Testi (Rubin,1983&Mehrotra,1997)
Bu istatistiğin, serbestlik dereceleri v1ve v olan F dağılımı gösterdiği varsayılır. BF >F(v1,v;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. v1 serbestlik derecesi,k=2 olduğu durumda sadece varyanslar homojense (k-1)’e eşit oluyor.Öncesinde serbestlik derecesi (k-1) diye sınırlanmıştı.Bu durumda Brown-Forsythe için kritik değer olması gerekenden küçük çıkıyor.Bu nedenle de düzeltilmiş Brown-Forsythe testi önerilmiştir.

14 Yaklaşık ANOVA F Testi (Box,1954&Asiribo&Gurland,1990)
Test istatistiği; Brown-Forsythe ve düzeltilmiş Brown-Forsythe testleri ile aynıdır. Bu istatistiğin, serbestlik dereceleri v1 ve v2 olan F dağılımı gösterdiği varsayılır. AAF >F(v1,v2;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir.

15 CochranTesti (Cochran,1937)
Test istatistiği şeklindedir. Cochran istatistiği (k-1) serbestlik dereceli χ2 dağılır. C >χ2(k-1;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. Normal dağılım sağlandığında daha iyi sonuçlar verdiği için genelde normallik ön şartı aranıyor.Ancak normallik varsayımı var şeklinde katı bir ifade söyleyemiyoruz.

16 Marascuilo Testi (Marascuilo,1971)
Test istatistiği şeklindedir. Literatürde nadir rastlanan bir testtir.

17 Marascuilo Testi (Marascuilo,1971)
Λ ,hata serbestlik derecesinde bir düzeltme yapmak için kullanılır. Bu istatistiğin, serbestlik dereceleri (k-1) ve (1/Λ) olan F dağılımı gösterdiği varsayılır. M >F(k-1,1/Λ;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir.

18 Scott-Smith Testi (Scott&Smith,1971)
Test istatistiği şeklindedir. Fs istatistiği,k serbestlik dereceli χ2 dağılımına yakınsamaktadır. Fs >χ2(k;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. Literatürde nadir rastlanan bir testtir.

19 Alternatif Yöntemlerin Karşılaştırılması

20 M.MENDEŞ&E.BAŞPINAR,2003 Bu çalışmada,değişik varyans
örneklem genişliği dağılım şekli kombinasyonları için simülasyon denemesi yapılmıştır.Bu simülasyonlar sonucunda alternatif testlerden elde edilen I.Tip hata olasılıkları karşılaştırılmıştır. Dağılım şekilleri olarak beta(4,14) ve χ2(5) belirlenmiştir.Fortran’dan yararlanarak sayılar üretildiği gibi,hesaplamalarda da bu program kullanılmıştır.%4.5-%5.9 arası I.Tip hata olasılığı gerçekleştiren testlerin iyi sonuç verdiği varsayılmıştır.

21 M.MENDEŞ&E.BAŞPINAR,2003 Varyanslar homojen olduğunda;
Deneme başında kararlaştırılan %5’lik I.Tip hata olasılığını deneme sonunda F testinin koruduğu görülmüştür. Varyanslar 1:2:3 olacak şekilde heterojenleştirildiğinde; F testinin,örneklerde eşit sayıda gözlemin olması halinde,heterojenlikten etkilenmediği,örneklerdeki gözlem sayılarının farklılaşması halinde ise,oldukça olumsuz etkilendiği gözlenmiştir.

22 M.MENDEŞ&E.BAŞPINAR,2003 Bu deneme koşullarında (örneklerin dengesiz olması),genel olarak en iyi sonuçları Marascuilo ve Welch testlerinin verdiği görülmektedir. Varyanslar 1:5:9 olacak şekilde heterojenleştirildiğinde; Bütün gözlem kombinasyonlarında Welch testinin en güvenilir test olduğu söylenebilir.

23 E.YİĞİT&H.GAMGAM,2011 Bu çalışmada ortalamaları eşit olarak belirlenen k=3 k=5 k=7 sayıdaki kitleler için,değişik varyans örneklem genişliği varyans ile örneklem genişliğinin doğru ve ters orantılı olduğu durum kombinasyonları için simülasyon denemesi yapılmıştır.Bu simülasyonlar sonucunda alternatif testlerden elde edilen I.Tip hata olasılıkları karşılaştırılmıştır. Bu çalışmada Matlab R2008a program dili kullanılmıştır.

24 E.YİĞİT&H.GAMGAM,2011 Örneklem hacimleri eşit ve varyanslar heterojen olduğunda; Welch ve Brown-Forsythe testlerinin deneysel I.Tip hata oranlarının nominal α=0.05 değerine yakın sonuçlar verdiği görülmüştür. Scott-Smith testinin diğer testlere göre heterojenlikten çok fazla olumsuz yönde etkilendiği görülmüştür.

25 E.YİĞİT&H.GAMGAM,2011 Örneklem hacimleri ile varyanslar doğru orantılı olduğunda; Welch ve Brown-Frosythe testlerinin deneysel I.Tip hata oranlarının nominal α=0.05 değerine oldukça yaklaştığı gözlenmiştir. Örneklem hacimleri ile varyanslar ters orantılı olduğunda; Örneklem hacimleri arttıkça Welch testinin deneysel I.Tip hata oranının nominal α=0.05 değerine yaklaştığı görülmüştür.

26 E.YİĞİT&H.GAMGAM,2011 Aynı çalışmada,
farklı ortalamalı,normal dağılıma sahip kitlelerden ni hacimli örneklemler seçilmiştir (i=1,…,k j=1,…,ni). k=3 k=5 k=7 sayıdaki kitleler için farklı örneklem hacimleri ve farklı kitle varyanslarının çeşitli kombinasyonları için; 5.000 simülasyon denemesi yapılmıştır.Bu simülasyonlar sonucunda her bir test istatistiğinin deneysel güç değerleri karşılaştırılmıştır.

27 E.YİĞİT&H.GAMGAM,2011 Örneklem hacimleri arttığında;
F testinin deneysel I.Tip hata oranları nominal α=0.05 değerine yakın sonuçlar vermesine rağmen,diğer testlere göre güç değerleri daha düşüktür. Örneklem hacimlerinin küçük olması; Tüm testlerin güç değerlerini düşürmüştür. Welch testinin,genel olarak diğer testlere göre daha yüksek güç değerlerine sahip olduğu gözlenmiştir.

28 M.MENDEŞ&A.PALA,2004 Bu çalışmada,örneklem genişlikleri k=3 ve k=6 olan iki durum ele alınmıştır ve değişik varyans örneklem genişliği dağılım şekli kombinasyonları için simülasyon denemesi yapılmıştır. Dağılım şekilleri olarak;normal,t(5),χ2(3),üssel(0.75) olarak belirlenmiştir.Fortran programı kullanılmıştır.

29 M.MENDEŞ&A.PALA,2004 Genel olarak;
Normal dağılımın sağlandığı ve örneklem genişliklerinin eşit olduğu durumda; Brown-Forsythe, düzeltilmiş Brown-Forsythe ve Yaklaşık Anova testlerinin benzer ve kabul edilebilir I.Tip hataya sahip oldukları görülmüştür. Örneklem genişlikleri dengesizleştiğinde bu testlerde bir miktar farklılık görülmüştür.

30 M.MENDEŞ&A.PALA,2004 Dağılım normallikten farklılaştığında,örneklem genişlikleri benzer ve varyanslar homojen olduğunda; Cochran testi için I.Tip hata oranı %5’ten büyük,Brown-Forsythe, düzeltilmiş Brown-Forsythe ve Yaklaşık Anova F testleri için I.Tip hata oranı %5’ten küçük bulunmuştur. Ki-kare veya üssel dağılım olduğunda,örneklem genişlikleri 30’dan büyük olsa bile Cochran testinin başlangıçta belirlenen α=0.05 düzeyinden fazlasıyla saptığı görülmüştür

31 M.MENDEŞ&A.PALA,2004 Varyanslar heterojen,örneklem genişlikleri benzer ve normal dağılım olduğunda; Cochran testi,sadece örneklem büyüklüğü 24 ve üzerinde olursa önceden belirlenen α=0.05 değerine yaklaşıyor. Düzeltilmiş Brown-Forsythe ve Yaklaşık Anova F testleri α=0.05 düzeyine en yakın sonuçları vermişlerdir.

32 M.MENDEŞ&A.PALA,2004 Varyans heterojenliğinin çok küçük olması,örneklem genişlikleri benzer ve normal dağılım olması durumunda; En uygun sonuçları Brown-Forsythe, düzeltilmiş Brown-Forsythe ve Yaklaşık Anova F Testi vermiştir.

33 M.MENDEŞ&A.PALA,2004 Dağılım normalliği bozulduğunda;
Diğer bütün testlere göre Brown-Forsythe testi, önceden belirlenen I.Tip hata düzeyine daha yakın sonuçlar vermiştir. Bütün testler,örneklem genişliğinin küçük olmasından etkilenmiştir.

34 F Testinin; Dağılım şeklinden etkilenmediği, yani normallik ön şartından pek etkilenmediği, Eşit örnek genişliklerinde,homojenlikten olan küçük sapmalardan etkilenmediği, Gruplardaki gözlem kombinasyonlarının dengeli olup olmamasından etkilendiği, Varyanslar homojense en sağlam (robust) test olduğu,

35 F Testinin; Homojenlikten sapma derecesine paralel olarak giderek sapmalı sonuçlar verdiği, yani varyansların homojenliği ön şartının sağlanıp sağlanmamasından oldukça etkilendiği, Grup sayısından etkilenmediği gözlenmiştir.

36 Alternatif Testlerin;
Dağılım şeklinden oldukça etkilendikleri, Gruplardaki gözlem sayılarının dengeli olup olmamasından etkilendikleri Genel olarak bütün koşullar için ele alınan testlerden hiçbirinin F testinin yerine kullanılamayacağı ve bunların belirli deneme koşullarında F testine alternatif olabilecekleri,

37 Alternatif Testlerin;
Dağılım şekli ve gruplardaki gözlem sayılarına bağlı olarak, bu testlerin de aşırı heterojenlikten oldukça fazla etkilendikleri sonucuna varılmıştır.

38 SONUÇ Varyans analizi varsayımları sağlandığı durumda;bahsedilen alternatif parametrik testlerin hiç birinin F testi yerine kullanılmasının uygun olmayacağı; Alternatif test kullanmamız gereken durumda; genel olarak incelendiğinde Welch testinin en uygun sonuçları verdiği ve Brown-Forsythe testinin de onu izlediği görülmüştür.

39 Kaynaklar M.Mendeş&E.Başpınar,Normal Olmayan Dağılımlı Populasyonlardan Alınan Örneklerde Hesaplanan Çeşitli Test İstatistiklerinin I.Tip Hata Bakımından Karşılaştırılması,2002 E.Yiğit,Homojen Olmayan Varyans Varsayımı Altında Tek Yönlü Varyans Analizinde Kullanılan Test İstatistikleri ve Bir Karşılaştırma,Yüksek Lisans Tezi,2009 D.V.Mehrotra,Improving The Brown-Forsythe Solution To The Generalized Behrens-Fisher Problem,1997 M.Mendeş&A.Pala,Evaluation of Four Tests When Normality and Homogeneity of Variance Assumptions are Violated,2004

40 Kaynaklar E.Yiğit&H.Gamgam,Homojen Olmayan Varyans Varsayımı Altında Ortalamaların Eşitliği İçin Bazı Test İstatistikleri ve Karşılaştırmaları,2011 D.Argaç,Testing for Homogeneity in a General One-Way Classification with Fixed Effects:Power Simulations and Comparative Study,2002 J.Hartung&D.Argaç&K.H.Makambi,Small Sample Properties of Tests on Homogeneity in One-Way Anova and Meta-Analysis,2002 B.L.Welch,On the Comparison of Several Mean Values:An Alternative Approach

41 Ankara Üniversitesi Biyoistatistik Anabilim Dalı
TEŞEKKÜRLER Funda ÖZALP Ankara Üniversitesi Biyoistatistik Anabilim Dalı


"Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri" indir ppt

Benzer bir sunumlar


Google Reklamları