HAZIRLAYANLAR: Süleyman BÜYÜKALPELLİ TWO WAY ANOVA F TESTİ HAZIRLAYANLAR: Süleyman BÜYÜKALPELLİ
F DAĞILIMI Normal dağılımlı iki ana kütleden rastgele seçimle sırasıyla n1 ve n2 örneklerini elde ederek, bu örneklemelerden hareketle; sırasıyla örnekleme varyansları olan s12 ve s22 elde edilip daha sonra bunlar birbirlerine oranlandığında bunların dağılımı F- dağılımı olarak adlandırılır. Örneklemden hesaplanan bir F oranının teorik bir F tablo değeri ile karşılaştırılarak hesaplanan F oranının istatistiksel olarak anlamlı olup olmadığının anlaşılması F testi olarak adlandırılır. Bu bölümde yer alan F testi tek taraflı bir testtir ve red bölgesi daima sağ taraftadır. F dağılımında pay ve paydada yer alan serbestlik dereceleri büyüdükçe dağılımın şekli simetriye yaklaşır. Varyans analizi bir veya iki bağımsız (nitel) değişkenli olabilir. Tek bağımsız değişken durumuna Tek Yönlü Varyans Analizi, iki bağımsız değişkenli duruma Çift Yönlü Varyans Analizi adı verilir. Fonksiyonel olarak bu durumlar, Tek Yönlü Varyans Analizi: Y = f(X) + hata Çift Yönlü Varyans Analizi: Y = f (X, Z) + hata
F DAĞILIMININ ÖZELLİKLERİ F- dağılımının bir ailesi vardır. Çünkü, F- dağılımı fonksiyonunun şekli, payının ve paydanın serbestlik derecesinden oluşan iki parametre ile belirlenmektedir. F- Dağılımı ailesinde eğrilerin şekilleri pay ve paydanın serbestlik derecelerine göre değişiklik göstermektedir. F- değeri negatif olamaz F- dağılımı bir sürekli dağılımdır. F- dağılımını gösteren eğri pozitif yöne kıvrımlıdır. F- dağılımını 0 ile + aralığındadır. F’nin değeri arttıkça eğri X- eksenine yaklaşır, ancak X- eksenini asla kesmez. F- değerleri önemlilik seviyesi ’ya göre çizelge halinde F- dağılımı çizelgesinde gösterilmektedir ve olasılıklar bu çizelgeden okunmaktadır. Genelde F- değeri 1’den büyük olan çizelgelerden yararlanıldığından buna uygun olarak F- değerini elde edilmesinde payın serbestlik derecesi varyansı büyük olan örneklemeye, paydanın serbestlik derecesi varyansı küçük olan örneklemeye ilişkin olarak alınmaktadır.
F DAĞILIMIN KULLANILMASI İki anakütle varyansının kıyaslanmasında F- dağılımının kullanılmasının sebebini araştırmak için iki durum incelensin. Durum I: İki torna makinesi; aynı özelliklere sahip bir çamaşır makinası kapak mandalının üretilmesi amacıyla ayarlanmıştır. Sözü edilen kapak mandalları aynı ortalama uzunluğuna sahip olmalıdırlar. Durum II: Bir çamaşır makinası ile bir bulaşık makinasından oluşan iki farklı stoğun ortalama geri dönüş oranı aynı olabilir. Bu iki farklı durumdan şu özellikler çıkarılabilir: I)Çamaşır makinası kapak mandalı örneğinde aynı ortalama uzunlukta olmaları bilgisi gibi, benzer varyasyona sahip olduklarından da emin olunmak istenecektir, II) İki stok örneğinde ise; birinin geri dönüşündeki varyasyon diğerinden daha çok olabilecektir. Tüm bu örneklemelerdeki nedenlerden dolayı, anakütleler normal dağılımlı ve veriler en azından () ile + aralık skalasında olduğunda iki anakütle varyanslarının F- dağılımının kullanılması gerektiği açıkça ortadadır.
F-ORANI Normal dağılımlı iki ana kütlenin varyansının tahminlemesinde, örnekleme varyanslarından yararlanıldığı zaman F- oranı kullanılmaktadır.
F-ORANINYLA İLGİLİ ÖRNEK SORU Normal dağılımlı iki ana kütlenin birisinden rastgele şeçimle n1 = 26 elemandan oluşan bir örnekleme alınmıştır. Ve standart sapmasıda 11 olarak hesaplanmıştır. Benzer şekilde diğer anakütleden n2=19 elemandan meydana gelen bir örnekleme rastgele seçimle gerçekleştirilmiştir. Bu örneklemenin standart sapması 10 olarak tespit edilmiştir. Bu verilerden hareketle, F- oranını hesaplayın.
F-ORANINYLA İLGİLİ ÖRNEK SORU ÇÖZÜMÜ Normal dağılımlı iki ana kütlenin varyansının tahminlenmesinde, örnekleme varyanslarından yararlanıldığında F- Oranı kullanılır.F oranını 1 den büyük olması için büyük olan varyansı paya yazılır. F- fonksiyonunun s.d1 = n1 – 1 = 26 – 1 = 25 ve s.d.2 = n2 – 1= 19 – 1 = 18 olmak üzere iki parametresi vardır Fhes = (26) (11)2/ 26 – 1 = 125.84 (19) (10)2/ 19 – 1 105.55 Fhes 1.192
F- TESTİ F- testini gerçekleştirmek için dört adımlı klasik hipotez testi algoritması kulanılır: Adım I: Hipotezlerin Kurulması: Bir ana kütlenin bir diğer ana kütleden daha çok varyasyona sahip olduğu ya da bir istatistiksel test ile ilgili olarak bir varsayımın geçerli kılınmasının belirlemek istenip, istenmediği önemsenmeden, sıfır hipotezi kurulur. Araştırma için sıfır hipotezi; birinci normal dağılımlı ana kütlenin varyansı 12’e, ikinci normal dağılımlı ana kütlenin varyansı 22’ye eşit olduğu esasına göre dizayn edilir. Testin çalıştırılmasında ilk olarak birinci ana kütleden rastgele seçimle n1 örneklemesi, ikinci ana kütleden rastgele seçilme ise n2 örneklemesi yapılır ve hipotezler şöyle kurulabilir
F- TESTİ I) H0: 12 = 22 II) H0: 12 = 22 III) H0: 12 = 22 HA: 12 22 HA: 12 22 HA: 12 22 Adım II: Karar Kuralının Belirlenmesi: Ek’teki F- dağılımı çizelgesinden; önemlilik seviyesi dikkate alınarak payın serbestlik derecesi varyansı büyük olan örneklemeye paydanın serbestlik derecesi varyansı küçük olan örneklemeye ait olarak, payın serbestlik derecesi yataydan, paydanın serbestlik derecesi dikey eksenden bulunarak, her ikisinin kesim noktasındaki okunan değer Fçiz’yi verir. Adım III: Test istatistiğinin Hesaplanması: Fhes = s12 s22 Burada; s12 : Birinci örneklemenin varyansını, S22 : İkinci örneklemenin varyansını göstermektedir. Adım IV: Kararın Verilmesi: Fhes Fçiz ise; H0 red edilemezl ve HA : Red Fhes Fçiz ise; H0 Red ve HA :red edilemez,kabul edilir.
F- TESTİ SORU ÖRNEĞİ A şirketi, 12 volt’luk BC ve EF tiplerinde iki farklı otomobil akülerini seri olarak üretmektedir. Ve şirket her ikisinde kullanım dışı kalma sürelerinin normal dağılımı gösterdiğini kabul etmektedir. İki örneklemeyle test yapılması düşünülmektedir. Bunu gerçekleştirebilmek için BC – tipi aküden rastgele seçimle 25 adet örnekleme yapılmıştır ve bu örneklemenin varyansıda 8 yıl olarak hesaplanmıştır. Aynı şekilde EF – tipi aküden rastgele seçimle 22 adeti örneklenmiştir. Bunun standart sapması da 7.5 yıl olarak belirlenmiştir. = 0.10 önemlilik seviyesinde bu iki tip akünün kullanım dışı kalma sürelerinin varyansları arasında fark var mıdır, hipotez testini kurarak, karar verin. Çözüm: Dört aşamalı hipotez testi kullanılır , Adım I: H0 : 12 = 22 HA : 12 22 Çift – Taraflı Test
F- TESTİ SORU ÖRNEĞİ Adım II: İlk olarak serbestlik dereceleri belirlenir. n1 – 1 = 25 – 1 = 24 n2 – 1 = 22 – 1 = 21 önemlilik seviyesi çift – taraflı test için: = 0.10 = 0.05 2 olarak hesaplanır b Bu iki parametreden hareketle; ek’teki F- dağılımı çizelgesinden 0.05’e göre; yatay eksenden payın serbestlik derecesi olan 24, dikey eksenden ise paydanın serbestlik derecesi olan 21 kullanılarak her ikisinin kesim noktasındaki değer olan Fçiz = 2.05 elde edilir. Adım III: Test İstatistiği Fhes= s12 = 8 1.07 s22 7.5 Adım IV: Fhes 1.07 Fçiz = 2.05 olduğundan H0 : Red edilemez ve HA: Red edilir. Diğer bir anlatımla; varyanslar arasındaki fark rastgeledir. Bu sonuca göre; şirketin, akülerin kullanım dışı kalma sürelerinin aynı varyasyonda olduğu kabulü doğrudur.
VARYANS ANALİZİ İstatistik bilim dalinda varyans analizi (veya ANOVA), gözlenen varyansı çeşitli kısımlara ayırma yöntemiyle bazı değişkenlerin başka bir değişken üzerindeki etkisini incelemeye yarayan bir grup modelleme türü ve bu modellerle ilişkili işlemlere verilen genel isimdir. Bu tür modeller gözümlenen varyansın çeşitli açıklayıcı değişkenlerin etki parçalarına bölmelesini incelerler.
VARYANS ANALİZİ ANOVA olarak adlandırılan varyans analizi, üç ya da daha fazla sayıdaki ana kütlelerin ortalamalarının eşit olup, olmadığını aynı anda test etmekte kulanılan bir teknik olarak tanımlanabilir. ANOVA, F- test istatistiği olarak F- dağılımını kullanmaktadır. Bir otomobil imalatçısı, yeni geliştirdiği bir V-tipi motorun yakıt tüketimini denemek için farklı benzinler kullansın. Bu benzinler; normal, katkısız normal, süper ya da kurşunlu olsun. Benzin sınıfları aynı sonucu üretiyor mu sorusuna en iyi cevap ANOVA’nın uygulanmasıyla verilebilir.
VARYANS ANALİZİ Varyans Analizinin Kullanılabilmesi İçin Gerekli Koşullar: ANOVA testinin kullanılabilmesi için şu şartlar sağlanmalıdır. I) İlgili ya da birden fazla ana kütlenin normal dağılımı göstermesi gereklidir. II) Bu anakütleler, eşit standart sapmalara sahip olmalıdır. III) Ana kütlelerden seçilen örnekler, rastgele seçimle elde edilir ve bağımsız örneklemeler olup, birbirleriyle ilişkili değildir.
TEK YÖNLÜ ANOVA F- TESTİ Tek-yönlü varyans analizinin çözümünde klasik dört aşamalı hipotez testi kullanılır. Adım I: Hipotezlerin Kurulması: H0: 1 = 2 = 3 = ............... = k HA: En azından iki ortalama birbirinden farklıdır. Adım II: Karar Kuralının Belirlenmesi: Önemlilik seviyesi genelde şart olmamakla birlikte, % 5 ya da % 1 alınabilmektedir. Bundan sonra, serbestlik dereceleri formüle edilir. Payın Serbestlik Derecesi : k – 1 Paydanın Serbestlik Derecesi: k ( n – 1) = kn – k = N – k
TEK YÖNLÜ ANOVA F- TESTİ Burada; k: Sütunların sayısını, n: Gözlemlerin sayısını, N: Gözlemlerin toplam sayısını ifade etmektedir. Ek’teki ilgili önemlilik seviyesine ilişkin F- dağılımı çizelgesinden yataydan payın serbestlik derecesi ve dikey eksenden paydanın serbestlik derecesi bulunarak, her ikisinin kesim noktasındaki değer Fçiz olarak okunur. Adım III: Test İstatistiğinin Hesaplanması: Uygun test istatistiği F- dağılımıdır. ANOVA - testinin prosedürünün temeli şu varsayımlara dayanmaktadır. I. Veriler en azından aralık skalasında olmalıdır. II. Bir olasılık – tipi prosedürü kullanılmalıdır. III. Anakütlelerin normal dağılımlı olması gereklidir. IV. Ana kütleler eşit varyanslı olmalıdır. V. Örneklemeler ana kütlelerden rastgele seçimle elde edilmelidir.
TEK YÖNLÜ ANOVA F- TESTİ SAKT:sütunlar arası kareler toplamı, k:sütunların sayısını SİKT:sütunlar içi kareler toplamını N:gözlemlerin toplam sayısını SAOK:sütunlar arasındaki ortalama kareyi OKH:ortalama kare hatasını ya da sütunlar içi ortalama kareyi gösterir.
TEK YÖNLÜ ANOVA F- TESTİ Sütunlar arasındaki Kareler Toplamı; Burada n.k=N ‘ i vermektedir
TEK YÖNLÜ ANOVA F- TESTİ TV=Sütunlar arasındaki kareler toplamı + Sütunlar içi kareler toplamı TV= SAKT + SİKT
TEK YÖNLÜ ANOVA F- TESTİ SORU: 1 Kişiler zayıflamak amacıyla üç çeşit diet programı uygulamaktadır. Diet –I’i kullanan kişiler arasında bir rastgele seçimle örnekleme elde edilmiştir. Diet-II ve Diet-III’den faydalananlardan ise,ayrı ayrı rastgele örneklemeler seçilmiştir. 0.05 önemlilik seviyesinde ANOVA testini kurarak , anakütle ağırlık kayıplarının eşit olup olmadığını tablo verilerini kullanarak bulunuz.
TEK YÖNLÜ ANOVA F- TESTİ SORU: 1 Ho: Anakütle ortalama ağırlık kayıpları eşittir. HA: Anakütle ortalama ağırlık kayıpları eşit değildir. Önemlilik seviyesi 0.05 olarak seçilmiştir. N=n1+n2+n3=6+7+8=21 (gözlemlerin toplamı) Payın serbestlik derecesi: k-1=3-1=2 Paydanın serbestlik derecesi: k(n-1)=N-K=21-3=18 0.05 önemlilik seviyesine göre olan F-dağılımı tablosundan;yatay eksenden 2, dikey eksenden 18 bulunur. Kesişim değeri “Ftab=3.55 olarak hesaplanır.
TEK YÖNLÜ ANOVA F- TESTİ SORU: 1 SAKT=75,6
TEK YÖNLÜ ANOVA F- TESTİ SORU: 1 Fhes=2,73<Ftab=3,55 olduğundan Ho:red edilemez yani kabul edilir. HA:red edilir. Sonuç:Diet gruplarının ortalama kilo kayıpları birbirine eşittir.
İKİ YÖNLÜ ANOVA F- TESTİ Tek yönlü varyans analizinde;sütunlar arasındaki ve sütunlar dahilindeki varyasyon anlatılarak , varyasyonun sütunlardan kaynaklandığı ya da rastgele olduğu temel alınmıştır. Ancak, varyasyon için başka kaynaklarda olabilir. Varyasyon iki kaynaktan ya da diğer bir ifadeyle iki yönden oluştuğunda, F istatistiği için iki yönlü varyasyon uygulanabilir. İki yönlü varyans analizi, bu olasılılıklardan en az birini düşünmeye fırsat verilebilmektedir
İKİ YÖNLÜ VARYANS ANALİZİ ALGORİTMASI İki-yönlü varyans analizinde de dört adımlı klasik hipotez testi kullanılır: Adım I: hipotezin kurulması İki-yönlü varyans analizinin hipotezlerinin kurulması;iki ayrı sıfır hipotezinin incelenmesi şeklinde dizayn edilmektedir. Ho:Anakütle sütun ortalamaları aynıdır. HA=Anakütle sütun ortalamaları aynı değildir.
İKİ YÖNLÜ VARYANS ANALİZİ ALGORİTMASI II) Ho= anakütle blok(sıra)ortalamaları aynıdır. HA= anakütle blok (sıra) ortalamaları aynı değildir. Adım II: Karar kuralanın belirlenmesi: I no’lu sıfır hipotezinin testi için serbestlik oranları: Payın serbestlik derecesi: k-1 Paydanın serbestlik derecesi: (k-1) (n-1) II no’lu sıfır hipotezinin testi için serbestlik oranları: Payın serbestlik derecesi: n-1 Bunu takiben verilen ya da seçilen önemlilik seviyesine göre F-dağılımı çizelgesinden yataydan payın serbestlik derecesi,dikey eksenden de paydanın serbestlik derecesi aranarak,her ikisinin kesim noktasındaki değer Ftab.’yu bulmaktayız. Bu durum her iki yön içinde geçerlidir.
İKİ YÖNLÜ VARYANS ANALİZİ ALGORİTMASI Adım III: Test istatistiğinin hesaplanması
İKİ YÖNLÜ VARYANS ANALİZİ ALGORİTMASI Adım I’deki I no’lu durum için test istatistiği;
İKİ YÖNLÜ VARYANS ANALİZİ ALGORİTMASI Bloklara (Sıralara) ilişkin ortalama kare:
İKİ YÖNLÜ VARYANS ANALİZİ ALGORİTMASI SIKT = TV - SAKT – BIKT SAKT;Sütunlar arasındaki kareler toplamını TV;toplam varyasyonu göstermektedir. Adım IV: Fhes < Ftab ise Ho:red edilemez,kabul edilir. HA:red edilir. Fhes.> Ftab. İse Ho:red edilir.HA:red edilemez,kabul edilir.
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:1
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:1
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:1
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:1
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Varan seyahat şirketi, İzmir’den İstanbul’un merkezine kadar 0403 MERCEDES otobüslerle yolcu taşımaktadırlar. İzmir’den İstanbul’a kadar düşünülen dört ayrı güzergah vardır. Bu yollar E-7,E-8,E-9 ve E-10’dur. Şirket ,bu dört yol arasında ortalama seyahat zamanlarında bir fark olup olmadığını belirlemek amacıyla , bir deneme işlemi gerçekleştirmiştir. Bu dört güzergah ile elde edilen sonuçlar şöyledir ( saat)
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Soru: 0,05 önemlilik seviyesinde, dört güzergah arasında bir fark olup olmadığını , ayrıca haftanın günlerine göre değişim gösterip göstermediğini hipotez testini kurarak bulunuz. Çözüm: Sıfır hipotezi ; dört güzergahın arasında ortalama seyahat zamanının aynı olduğuna ilişkin kurulduğunda tek-yönlü varyans analizi yaklaşımını gerekli kılmaktadır. Diğer yön olan haftanın günlerindeki farklılıkların rastgele olarak değerlendirilmesi sebebiyle varyasyon meydana gelmektedir ve bu ortalama kare hatasının terimlerinde içerilmektedir. Haftanın günlerine göre varyasyon ortadan kaldırıldığında F-oranının paydası azaltılmış olacaktır. Bu durumda, haftanın günleri “bloklanmış değişken” adlandırılmaktadır. Buradan sütunlara ve sıralara göre varyasyon oluşturulacaktır.
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Adım I: İki yönlü hipotezler kurulur; I)Ho:Anakütle ortalama seyahat zamanları aynıdır. HA:Anakütle ortalama seyahat zamanları aynı değildir. II)Ho: Anakütle ortalama günleri aynıdır. HA: Anakütle ortalama günleri aynı değildir.
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Adım 2: İlk olarak anakütle ortalama seyahat zamanları hipotezi için serbestlik dereceleri bulunur: Payın serbestlik derecesi: (k-1) = 4-1= 3 Paydanın serbestlikderecesi:(k-1)(n-1)=(4-1)(7-1)=18 Verilen önemlilik seviyesiyle ilgili F dağılımı tablosundan payın serbestlik derecesi 3 yatay eksenden , paydanın serbestlik derecesi 18 dikey eksenden bulunarak , her ikisinin kesim noktasındaki değer Ftab=3,16 olarak bulunur. Diğer yön olarak anakütle ortalama günleri hipotezi için serbestlik dereceleri hesaplanır: Payın serbestlik derecesi: (n-1) = 7-1= 6 Paydanın serbestlik derecesi:(n-1)(k-1)=(7-1)(4-1)=18 Aynı şekilde F tablosundan Ftab=3,66 bulunur. Adım III: İlk olarak verilere göre iki-yönlü varyans analizine göre hesaplamalar şöyledir:
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 GÜN Güzergah için seyahat zamanları (saat) E-7 E-8 E-9 E-10 Sıra top. Pztesi 17 19 21 76 Toplam Salı 18 20 22 82 Çarş. 16 73 Perş. 25 87 Cuma 23 27 24 94 C.tesi 14 75 Pazar 74 Sütun top. 141 130 146 144 561 Kareler top 2907 2426 3156 2988 11487 Örneklem büyüklüğü 7 28
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 İki-yönlü varyans analiz çizelgesini oluşturmak için bazı hesaplamaların yapılması gerekir: Sütunlar arasındaki kareler toplamı: Bloklara(sıralara) ilişkin kareler toplamı:
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Bloklara ilişkin kareler toplamı; Toplam varyasyon:
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Sütunlar içindeki kareler toplamı: SIKT=TV-SAKT-BIKT SIKT = 246,96 - 21,82 - 93,71 SIKT = 131,43
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Adım I’deki I no’lu durum için test istatistiği: Ve II no‘lu yön için test istatistiği: olarak bulunmuştur. Adım IV: I no’lu yön için Fhes=1 ve Ftab=3,16 olması nedeniyle, Fhes=1<Ftab=3,16 Ho:red edilemez,kabul edilir.HA:red edilir.
İKİ YÖNLÜ VARYANS ANALİZİ ÖRNEK SORU:2 Diğer bir ifadeyle ortalama seyahat zamanları tüm güzergahlar için aynı olduğu şeklinde sonuçlanmıştır. II no’lu durum için ise Fhes=2,14 ve Ftab=3,66 olarak bulunmuştur. Fhes=2,14<Ftab=3,66 olduğundan Ho:red edilemez,kabul edilir.HA:red edilir.Yani anakütle ortalama günleri aynıdır.