Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri

Slides:



Advertisements
Benzer bir sunumlar
Normal Dağılım Dışındaki Teorik Dağılımlar
Advertisements

Çıkarımsal İstatistik
Uygun Hipotezin Kurulması, Tip I Hata ve Tip II Hata
Bölüm 5 Örneklem ve Örneklem Dağılımları
el ma 1Erdoğan ÖZTÜRK ma ma 2 Em re 3 E ren 4.
Kütle varyansı için hipotez testi
Sosyal Bilimlerde Araştırma Yöntemleri
BAĞIMSIZ ÖRNEKLEMLER İÇİN T TESTİ
İKİ ÖRNEKLEM TESTLERİ.
Diferansiyel Denklemler
NOKTA, DOĞRU, DOĞRU PARÇASI, IŞIN, DÜZLEMDEKİ DOĞRULAR
Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ
VARYANS ANALİZİ İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden.
TEK YÖNLÜ VARYANS ANALİZİ
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
THY SPSS UYGULAMASI 1.SORU:Kİ-KARE ANALİZİ
ANOVA.
Diferansiyel Denklemler
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
Algoritmalar DERS 2 Asimptotik Notasyon O-, Ω-, ve Θ-notasyonları
ANOVA (ANalysis Of Varyans)
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
KIR ÇİÇEKLERİM’ E RakamlarImIz Akhisar Koleji 1/A.
Prof. Dr. Leyla Küçükahmet
Tıp alanında kullanılan temel istatistiksel kavramlar
HAZIRLAYAN:SAVAŞ TURAN AKKOYUNLU İLKÖĞRETİM OKULU 2/D SINIFI
ÖRNEKLEM VE ÖRNEKLEME Dr.A.Tevfik SÜNTER.
İki Ortalama Arasındaki Farkın Önemlilik Testi
ARALARINDA ASAL SAYILAR
Süt Pazar Durumu Brüksel, 19 Ocak Pazar Durumu– 19 Ocak AB Üretimleri AB-27 Tedarik/Üretim Gelişmeleri Ocak-Ekim 2011 ile Ocak-Ekim 2010 kıyaslaması.
Tam sayılarda bölme ve çarpma işlemi
Prof. Dr. Hüseyin BAŞLIGİL
HABTEKUS' HABTEKUS'08 3.
ÖNEMLİLİK TESTLERİ Dr.A.Tevfik SÜNTER
SİU 2009 Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler Ethem Alpaydın Boğaziçi Üniversitesi
Mukavemet II Strength of Materials II
Yard. Doç. Dr. Mustafa Akkol
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
Diferansiyel Denklemler
1 DEĞİŞMEYİN !!!
DENEY TASARIMI VE ANALİZİ (DESIGN AND ANALYSIS OF EXPERIMENTS)
İki Ortalama Farkının Test Edilmesi
Bankacılık sektörü 2010 yılının ilk yarısındaki gelişmeler “Temmuz 2010”
1 (2009 OCAK-ARALIK) TAHAKKUK ARTIŞ ORANLARI. 2 VERGİ GELİRLERİ TOPLAMIDA TAHAKKUK ARTIŞ ORANLARI ( OCAK-ARLIK/2009 )
Çocuklar,sayılar arasındaki İlişkiyi fark ettiniz mi?
Toplama Yapalım Hikmet Sırma 1-A sınıfı.
TEK YÖNLÜ MANOVA Birden fazla bağımlı değişkene tek bir bağımsız değişkenin etki ettiği durumlarda Tek Yönlü MANOVA kullanılır. Tek yönlü MANOVA da başlangıç.
14.ULUSAL TURİZM KONGRESİ 2013 YILI BİLDİRİLERİ ÜZERİNE BİR DEĞERLENDİRME Prof. Dr. A. Celil ÇAKICI Mersin Üniversitesi Turizm Fakültesi.
1.HAFTA 26 Ağustos 2009 ÇARŞAMBA 2.HAFTA 01 EYLÜL 2009 SALI 3.HAFTA 09 EYLÜL 2009 ÇARŞAMBA 4.HAFTA 15 EYLÜL 2009 SALI 5.HAFTA 23 EYLÜL 2009 ÇARŞAMBA 6.HAFTA.
1.HAFTA 26 Ağustos 2009 ÇARŞAMBA 2.HAFTA 01 EYLÜL 2009 SALI 3.HAFTA 09 EYLÜL 2009 ÇARŞAMBA 4.HAFTA 15 EYLÜL 2009 SALI 5.HAFTA 23 EYLÜL 2009 ÇARŞAMBA 6.HAFTA.
ÖĞR. GRV. Ş.ENGIN ŞAHİN BİLGİ VE İLETİŞİM TEKNOLOJİSİ.
Diferansiyel Denklemler
KRUSKAL WALLIS VARYANS ANALİZİ
İKİ YÖNLÜ MANOVA Birden fazla bağımlı değişkene iki bağımsız değişkenin etki ettiği durumlarda Çift Yönlü MANOVA kullanılır. Çift yönlü MANOVA da başlangıç.
Yrd. Doç. Dr. Hamit ACEMOĞLU
Uygulama I.
HİPOTEZ TESTLERİNE GİRİŞ
Maliye’de SPSS Uygulamaları Doç. Dr. Aykut Hamit Turan SAÜ İİBF/ Maliye Bölümü.
Örneklem Dağılışları ve Standart Hata
İstatistik-3 Prof.Dr. Cem S. Sütcü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D. cemsutcu.wordpress.com.
Non Parametrik Hipotez Testleri
HİPOTEZ TESTLERİNE GİRİŞ
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
Teorik Dağılımlar: Diğer Dağılımlar
Numerik Veri Tek Grup Prof. Dr. Hamit ACEMOĞLU.
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
İSTATİSTİK II Hipotez Testleri 1.
Sunum transkripti:

Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri Funda ÖZALP Ankara Üniversitesi Biyoistatistik Anabilim Dalı

Neden Kullanıyoruz? Varyans analizi,her biri normal dağılıma sahip olan birbirinden bağımsız ikiden fazla grup ortalamasını karşılaştırmak amacıyla kullanılır. k: Grup sayısı ni: i.gruptaki denek sayısı

Nasıl Uyguluyoruz? şeklinde hesaplanan test istatistiği (k-1) ve (n-k) serbestlik dereceli F dağılımı gösterir.

Varsayımları Nelerdir? ni hacimli örneklemlerin her biri normal dağılım göstermektedir. Örneklemler rastgele olarak seçilmiştir ve bağımsızdır. ni hacimli örneklemlerin varyansları homojendir.

Varsayımlar Bozulursa? Genel olarak üç çözüm yolu önerilmektedir: Verileri, dönüşüm yoluyla varyans analizi tekniğine uygun hale getirmek Uygun bir parametrik olmayan test ile analiz etmek Varyans analizi tekniği yerine alternatif parametrik testleri kullanmaktır.

Alternatif Testler Nelerdir? Welch Testi Değiştirilmiş (Modified) Welch Testi Brown-Forsythe Testi Değiştirilmiş (Modified) Brown-Forsythe Testi Yaklaşık (Approximate) Anova F Testi Cochran Testi Marascuilo Testi Scott-Smith Testi Bu test istatistiklerinin bazılarının dağılımı tam olarak bilinirken,bazılarının dağılımı simülasyon yardımıyla yaklaşık olarak bulunur. Normal dağılım ve varyans homojenliği varsayımlarından biri veya ikisi birden bozulduğunda kullanılabilir.

Welch Testi (Welch,1951) Test istatistiği; şeklindedir. W>F(k-1,f;1-α) ise ortalamaların eşitliği hipotezi(H0) reddedilir. Homojen varyans varsayımı sağlanmadığında ilk olarak normal dağılıma sahip iki kitle ortalamasının eşitliğine ait hipotez testi incelenmiştir.Bu durum Behrens-Fisher problemi olarak da bilinir.Bunun için önerilen ilk testlerden biri Welch’tir(1947).Welch 1951’de k kitle ortalaması için testi genelleştirmiştir.

Düzeltilmiş Welch Testi (Hartung et al.,2001) Test istatistiği; şeklindedir. Welch,kitle sayısı çok ve örneklem genişlikleri küçük olduğunda “liberal” hale gelir,yani H0’ı reddetmek daha kolaylaşır.Bu yüzden düzeltilmiş Welch testi önerilmiştir.

Düzeltilmiş Welch Testi (Hartung et al.,2001) W*, yaklaşık olarak (K-1) ve vw* serbestlik dereceli olan F dağılımı gösterir. W*>F(K-1,vw*;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir.

Brown-Forsythe Testi (Brown&Forsythe,1974) Test istatistiği; şeklindedir. Bu istatistiğin, serbestlik dereceleri (k-1) ve v olan F dağılımı gösterdiği varsayılır. Literatürde Welch testinden sonra en sık karşılaşılan testtir.

Brown-Forsythe Testi (Brown&Forsythe,1974) BF >F(k-1,v;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. Klasik F testinin uyarlaması olan bir testtir.

Düzeltilmiş Brown-Forsythe Testi (Rubin,1983&Mehrotra,1997) Rubin ve Mehrotra,Brown-Forsythe testinde pay serbestlik derecesinde bir eksikliği incelediler. Brown-Forsythe pay serbestlik derecesi olarak (k-1) kullanırken,Rubin ve Mehrotra v1 serbestlik derecesini önermişlerdir.

Düzeltilmiş Brown-Forsythe Testi (Rubin,1983&Mehrotra,1997) Bu istatistiğin, serbestlik dereceleri v1ve v olan F dağılımı gösterdiği varsayılır. BF >F(v1,v;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. v1 serbestlik derecesi,k=2 olduğu durumda sadece varyanslar homojense (k-1)’e eşit oluyor.Öncesinde serbestlik derecesi (k-1) diye sınırlanmıştı.Bu durumda Brown-Forsythe için kritik değer olması gerekenden küçük çıkıyor.Bu nedenle de düzeltilmiş Brown-Forsythe testi önerilmiştir.

Yaklaşık ANOVA F Testi (Box,1954&Asiribo&Gurland,1990) Test istatistiği; Brown-Forsythe ve düzeltilmiş Brown-Forsythe testleri ile aynıdır. Bu istatistiğin, serbestlik dereceleri v1 ve v2 olan F dağılımı gösterdiği varsayılır. AAF >F(v1,v2;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir.

CochranTesti (Cochran,1937) Test istatistiği şeklindedir. Cochran istatistiği (k-1) serbestlik dereceli χ2 dağılır. C >χ2(k-1;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. Normal dağılım sağlandığında daha iyi sonuçlar verdiği için genelde normallik ön şartı aranıyor.Ancak normallik varsayımı var şeklinde katı bir ifade söyleyemiyoruz.

Marascuilo Testi (Marascuilo,1971) Test istatistiği şeklindedir. Literatürde nadir rastlanan bir testtir.

Marascuilo Testi (Marascuilo,1971) Λ ,hata serbestlik derecesinde bir düzeltme yapmak için kullanılır. Bu istatistiğin, serbestlik dereceleri (k-1) ve (1/Λ) olan F dağılımı gösterdiği varsayılır. M >F(k-1,1/Λ;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir.

Scott-Smith Testi (Scott&Smith,1971) Test istatistiği şeklindedir. Fs istatistiği,k serbestlik dereceli χ2 dağılımına yakınsamaktadır. Fs >χ2(k;1-α) ise ortalamaların eşitliği hipotezi (H0) reddedilir. Literatürde nadir rastlanan bir testtir.

Alternatif Yöntemlerin Karşılaştırılması

M.MENDEŞ&E.BAŞPINAR,2003 Bu çalışmada,değişik varyans örneklem genişliği dağılım şekli kombinasyonları için 100.000 simülasyon denemesi yapılmıştır.Bu simülasyonlar sonucunda alternatif testlerden elde edilen I.Tip hata olasılıkları karşılaştırılmıştır. Dağılım şekilleri olarak beta(4,14) ve χ2(5) belirlenmiştir.Fortran’dan yararlanarak sayılar üretildiği gibi,hesaplamalarda da bu program kullanılmıştır.%4.5-%5.9 arası I.Tip hata olasılığı gerçekleştiren testlerin iyi sonuç verdiği varsayılmıştır.

M.MENDEŞ&E.BAŞPINAR,2003 Varyanslar homojen olduğunda; Deneme başında kararlaştırılan %5’lik I.Tip hata olasılığını deneme sonunda F testinin koruduğu görülmüştür. Varyanslar 1:2:3 olacak şekilde heterojenleştirildiğinde; F testinin,örneklerde eşit sayıda gözlemin olması halinde,heterojenlikten etkilenmediği,örneklerdeki gözlem sayılarının farklılaşması halinde ise,oldukça olumsuz etkilendiği gözlenmiştir.

M.MENDEŞ&E.BAŞPINAR,2003 Bu deneme koşullarında (örneklerin dengesiz olması),genel olarak en iyi sonuçları Marascuilo ve Welch testlerinin verdiği görülmektedir. Varyanslar 1:5:9 olacak şekilde heterojenleştirildiğinde; Bütün gözlem kombinasyonlarında Welch testinin en güvenilir test olduğu söylenebilir.

E.YİĞİT&H.GAMGAM,2011 Bu çalışmada ortalamaları eşit olarak belirlenen k=3 k=5 k=7 sayıdaki kitleler için,değişik varyans örneklem genişliği varyans ile örneklem genişliğinin doğru ve ters orantılı olduğu durum kombinasyonları için 5.000 simülasyon denemesi yapılmıştır.Bu simülasyonlar sonucunda alternatif testlerden elde edilen I.Tip hata olasılıkları karşılaştırılmıştır. Bu çalışmada Matlab R2008a program dili kullanılmıştır.

E.YİĞİT&H.GAMGAM,2011 Örneklem hacimleri eşit ve varyanslar heterojen olduğunda; Welch ve Brown-Forsythe testlerinin deneysel I.Tip hata oranlarının nominal α=0.05 değerine yakın sonuçlar verdiği görülmüştür. Scott-Smith testinin diğer testlere göre heterojenlikten çok fazla olumsuz yönde etkilendiği görülmüştür.

E.YİĞİT&H.GAMGAM,2011 Örneklem hacimleri ile varyanslar doğru orantılı olduğunda; Welch ve Brown-Frosythe testlerinin deneysel I.Tip hata oranlarının nominal α=0.05 değerine oldukça yaklaştığı gözlenmiştir. Örneklem hacimleri ile varyanslar ters orantılı olduğunda; Örneklem hacimleri arttıkça Welch testinin deneysel I.Tip hata oranının nominal α=0.05 değerine yaklaştığı görülmüştür.

E.YİĞİT&H.GAMGAM,2011 Aynı çalışmada, farklı ortalamalı,normal dağılıma sahip kitlelerden ni hacimli örneklemler seçilmiştir (i=1,…,k j=1,…,ni). k=3 k=5 k=7 sayıdaki kitleler için farklı örneklem hacimleri ve farklı kitle varyanslarının çeşitli kombinasyonları için; 5.000 simülasyon denemesi yapılmıştır.Bu simülasyonlar sonucunda her bir test istatistiğinin deneysel güç değerleri karşılaştırılmıştır.

E.YİĞİT&H.GAMGAM,2011 Örneklem hacimleri arttığında; F testinin deneysel I.Tip hata oranları nominal α=0.05 değerine yakın sonuçlar vermesine rağmen,diğer testlere göre güç değerleri daha düşüktür. Örneklem hacimlerinin küçük olması; Tüm testlerin güç değerlerini düşürmüştür. Welch testinin,genel olarak diğer testlere göre daha yüksek güç değerlerine sahip olduğu gözlenmiştir.

M.MENDEŞ&A.PALA,2004 Bu çalışmada,örneklem genişlikleri k=3 ve k=6 olan iki durum ele alınmıştır ve değişik varyans örneklem genişliği dağılım şekli kombinasyonları için 50.000 simülasyon denemesi yapılmıştır. Dağılım şekilleri olarak;normal,t(5),χ2(3),üssel(0.75) olarak belirlenmiştir.Fortran programı kullanılmıştır.

M.MENDEŞ&A.PALA,2004 Genel olarak; Normal dağılımın sağlandığı ve örneklem genişliklerinin eşit olduğu durumda; Brown-Forsythe, düzeltilmiş Brown-Forsythe ve Yaklaşık Anova testlerinin benzer ve kabul edilebilir I.Tip hataya sahip oldukları görülmüştür. Örneklem genişlikleri dengesizleştiğinde bu testlerde bir miktar farklılık görülmüştür.

M.MENDEŞ&A.PALA,2004 Dağılım normallikten farklılaştığında,örneklem genişlikleri benzer ve varyanslar homojen olduğunda; Cochran testi için I.Tip hata oranı %5’ten büyük,Brown-Forsythe, düzeltilmiş Brown-Forsythe ve Yaklaşık Anova F testleri için I.Tip hata oranı %5’ten küçük bulunmuştur. Ki-kare veya üssel dağılım olduğunda,örneklem genişlikleri 30’dan büyük olsa bile Cochran testinin başlangıçta belirlenen α=0.05 düzeyinden fazlasıyla saptığı görülmüştür

M.MENDEŞ&A.PALA,2004 Varyanslar heterojen,örneklem genişlikleri benzer ve normal dağılım olduğunda; Cochran testi,sadece örneklem büyüklüğü 24 ve üzerinde olursa önceden belirlenen α=0.05 değerine yaklaşıyor. Düzeltilmiş Brown-Forsythe ve Yaklaşık Anova F testleri α=0.05 düzeyine en yakın sonuçları vermişlerdir.

M.MENDEŞ&A.PALA,2004 Varyans heterojenliğinin çok küçük olması,örneklem genişlikleri benzer ve normal dağılım olması durumunda; En uygun sonuçları Brown-Forsythe, düzeltilmiş Brown-Forsythe ve Yaklaşık Anova F Testi vermiştir.

M.MENDEŞ&A.PALA,2004 Dağılım normalliği bozulduğunda; Diğer bütün testlere göre Brown-Forsythe testi, önceden belirlenen I.Tip hata düzeyine daha yakın sonuçlar vermiştir. Bütün testler,örneklem genişliğinin küçük olmasından etkilenmiştir.

F Testinin; Dağılım şeklinden etkilenmediği, yani normallik ön şartından pek etkilenmediği, Eşit örnek genişliklerinde,homojenlikten olan küçük sapmalardan etkilenmediği, Gruplardaki gözlem kombinasyonlarının dengeli olup olmamasından etkilendiği, Varyanslar homojense en sağlam (robust) test olduğu,

F Testinin; Homojenlikten sapma derecesine paralel olarak giderek sapmalı sonuçlar verdiği, yani varyansların homojenliği ön şartının sağlanıp sağlanmamasından oldukça etkilendiği, Grup sayısından etkilenmediği gözlenmiştir.

Alternatif Testlerin; Dağılım şeklinden oldukça etkilendikleri, Gruplardaki gözlem sayılarının dengeli olup olmamasından etkilendikleri Genel olarak bütün koşullar için ele alınan testlerden hiçbirinin F testinin yerine kullanılamayacağı ve bunların belirli deneme koşullarında F testine alternatif olabilecekleri,

Alternatif Testlerin; Dağılım şekli ve gruplardaki gözlem sayılarına bağlı olarak, bu testlerin de aşırı heterojenlikten oldukça fazla etkilendikleri sonucuna varılmıştır.

SONUÇ Varyans analizi varsayımları sağlandığı durumda;bahsedilen alternatif parametrik testlerin hiç birinin F testi yerine kullanılmasının uygun olmayacağı; Alternatif test kullanmamız gereken durumda; genel olarak incelendiğinde Welch testinin en uygun sonuçları verdiği ve Brown-Forsythe testinin de onu izlediği görülmüştür.

Kaynaklar M.Mendeş&E.Başpınar,Normal Olmayan Dağılımlı Populasyonlardan Alınan Örneklerde Hesaplanan Çeşitli Test İstatistiklerinin I.Tip Hata Bakımından Karşılaştırılması,2002 E.Yiğit,Homojen Olmayan Varyans Varsayımı Altında Tek Yönlü Varyans Analizinde Kullanılan Test İstatistikleri ve Bir Karşılaştırma,Yüksek Lisans Tezi,2009 D.V.Mehrotra,Improving The Brown-Forsythe Solution To The Generalized Behrens-Fisher Problem,1997 M.Mendeş&A.Pala,Evaluation of Four Tests When Normality and Homogeneity of Variance Assumptions are Violated,2004

Kaynaklar E.Yiğit&H.Gamgam,Homojen Olmayan Varyans Varsayımı Altında Ortalamaların Eşitliği İçin Bazı Test İstatistikleri ve Karşılaştırmaları,2011 D.Argaç,Testing for Homogeneity in a General One-Way Classification with Fixed Effects:Power Simulations and Comparative Study,2002 J.Hartung&D.Argaç&K.H.Makambi,Small Sample Properties of Tests on Homogeneity in One-Way Anova and Meta-Analysis,2002 B.L.Welch,On the Comparison of Several Mean Values:An Alternative Approach

Ankara Üniversitesi Biyoistatistik Anabilim Dalı TEŞEKKÜRLER Funda ÖZALP Ankara Üniversitesi Biyoistatistik Anabilim Dalı