Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

ANOVA / MANOVA MODEL OLUŞTURMA VE VERİ ANALİZİ 2011 Bahar Irmak Çağlı Sennur Ulugönül Merve Bölükbaşı.

Benzer bir sunumlar


... konulu sunumlar: "ANOVA / MANOVA MODEL OLUŞTURMA VE VERİ ANALİZİ 2011 Bahar Irmak Çağlı Sennur Ulugönül Merve Bölükbaşı."— Sunum transkripti:

1 ANOVA / MANOVA MODEL OLUŞTURMA VE VERİ ANALİZİ 2011 Bahar Irmak Çağlı Sennur Ulugönül Merve Bölükbaşı

2 Genel Kavramlar Varyans: Değerlerin ortalamanın çevresindeki dağılımını ölçmek için en yaygın biçimde kullanılan nicelikler varyans ve varyansın karekökü olan standart sapmadır. Varyans analizi n bağımsız ya da n bağımlı gruptan elde edilen verilerin grup ortalamalarının ya da işlem ortalamalarının farklılığını test etmek için yaralanılan bir yöntemdir. Tekerrür: Aynı işlemin uygulandığı birden fazla deneme ünitesine verilen isimdir. Tekerrür sayısı arttıkça denemenin güvenilirliği artar. Ancak tekerrür sayısını arttırmak ek masraf, is gücü ve zaman gerektirdiğinden araştırıcı optimum sayıyı belirlemelidir.

3 Genel Kavramlar Tesadüfi Dağıtım: İşlem ortalamalarının ve deneme hatasının sapmasız tahminlerini elde edebilmek için bir işlemin herhangi bir deneme ünitesine düşme sansının, diğer bir deneme ünitesine düşme sansına eşit olması gerekir.

4 ANOVA T TESTİ İki ortalamanın karşılaştırılmasında kullanılan bir analiz yöntemidir. Karşılaştırılacak ortalama sayısı 2’nin üzerinde ise «Varyans Analizi» yöntemi kullanılır. Tek örneklem t ‐ testi Bağımsız iki örneklem t ‐ testi Bağımlı iki örneklem t ‐ testi

5 ANOVA Tek Örneklem T Testi Tek örneklem t ‐ testinde, aynı örneklemin ölçülen ortalaması ile tahmin edilen ya da bilinen ortalaması karşılaştırılır. Bir konuya ilişkin tahminlerinizin doğru olup olmadığını da tek örneklem t ‐ testini kullanarak test edilebilir. Örneğin; Ziraat Bankası gibi kişinin çalıştığı büyük bir kuruluşta anket çalışması yapmak istiyorsunuz. Anketi tüm çalışanlara uygulamak maliyetli olacağı için Örnekleme yapıp 400 kişilik bir örneklem seçtiğinizi varsayalım. Bu seçtiğiniz örneklemin ana kütlenin özelliklerini yansıtıp yansıtmadığını test etmek istiyorsanız «tek örneklem t ‐ testini» kullanabilir.

6 ANOVA Tek Örneklem t ‐ testi yaptığınız tahminin belirli bir anlamlılık düzeyinde doğru olup olmadığı gösterir. “Anlamlılık düzeyi” diyoruz çünkü ana kitledeki tüm bireyler hesaba katılmadığından ulaşılan sonuçta yanılma ihtimali her zaman olacaktır. Bu yanılma olasılığı; “0,05” anlamlılık düzeyi için % 5 (güven düzeyi %95), “0,01” anlamlılık düzeyi içinse % 1 (güven düzeyi %99) düzeyindedir. Sıfır hata için herkesi hesaba katmanız gerekir.

7 ANOVA Bağımsız İki Örneklem T Testi Tek örneklem t testinden farklı olarak iki ayrı grubun ortalamaları karşılaştırılır. Örneğin; bir sınıfta kız ve erkek öğrencilerin matematik dersinden aldıkları notlar arasında anlamlı bir fark olup olmadığı. Bağımlı İki Örneklem T Testi Örneğin; Yeni bir öğretim metodu uygulanan öğrencilerin bu metodtan önceki ve sonraki notlarının karşılaştırılmasında Bir işletmenin ISO 9001:2000 öncesi ve sonrası performansı

8 ANOVA İki farklı grup arasında karşılaştırma yapmamız gerektiğinde t testini kullanırız. Eğer grup sayısı ikiden fazla ise de varyans analizini kullanırız. ANOVA (Varyans Analizi) çeşitli popülasyonların ortalamaları arasındaki farkları tanımlamak için kullanılan İstatistiksel metottur. ANOVA bir birleşik testtir Çeşitli sayıda popülasyonun ortalamalarının eşitliği eş zamanlı olarak ya da birlikte test edilir.

9 ANOVA Bu yöntemle ilgili aşağıdaki hususlara dikkat edilmelidir: Gruplardaki bireyler birbirine benzer ve homojen olmalıdır. Gruplar birbirinden bağımsız olmalıdır. Bağımlı gruba uygulanmaz. Veriler ölçümle belirlenmiş sürekli karakter olmalıdır. Gruptaki denek sayıları birbirine eşit veya yakın olmalıdır.

10 ANOVA Varyans analizinin ön şartları su şekilde sıralanabilir: Normallik ön şartı Etkilerin eklenebilirliği ön şartı Bağımsızlık ön şartı Varyansların homojenliği ön şartı

11 ANOVA Normallik Ön Şartı Varyans analizi tekniğinin en önemli şartlarından birisi de gözlemlerin normal dağılım göstermesidir. Hataların dağılışının çok aşırı bir çarpıklık göstermesi halinde F testinin önemlilik seviyesinin çok fazla etkileneceği görülmüştür. Dolayısıyla, bu ön şart gerçekleşmediğinde standart normal dağılış veya F dağılışı yardımıyla doğru bir önemlilik testi yapılamayacağını belirtilmektedir. Etkilerin Eklenebilirliği Ön Şartı Uygulanabilecek her varyans analizi tekniği için bir model yazmak mümkündür, bu modelde bağımlı değişken olarak adlandırdığımız üzerinde durduğumuz özelliğe ait veriler, örneklerin çekildiği populasyona ait ortalama etkisi araştırılan faktörler ve etkisi tesadüfi olarak kabul edilen hata unsuru yer alır. En basitinden en karmaşığına kadar bu modellerde bahsedilen bu etkiler üst üste eklenirse söz konusu modele eklemeli model denir.

12 ANOVA Bağımsızlık Ön Şartı Gözlemlerin bağımsızlığından anlatılmak istenen; farklı işlem gruplarında yer alan ölçüm değerlerinin farklı deney ünitelerinden elde edilmiş olmasıdır. Varyansların Homojenliği Ön Şartı Varyans analizi tekniğinde hesaplanacak F istatistiğinin paydasında yer alan varyans unsuru hata kareler ortalaması olarak adlandırılır ve aslında bir toplanmış varyanstır. Dolayısıyla, bilinmeyen populasyon varyansının en iyi tahminidir. Bu varyans unsuru populasyondan rastgele seçilen ve birbirleri ile karşılaştırılmak istenen gruplara ait varyansların ortalamalarının hesaplanması ile bulunur. Toplama işlemi ancak toplanabilen değerlere uygulanabileceğine göre, gruptaki varyanslarında toplanabilmesi için birbirlerinden toplanamayacak kadar farklı olmaları gerekir ki buna homojenlik denir.

13 ANOVA F TESTİ İkiden çok örnek kütle ortalamalarının karşılaştırılmasında kullanılır. işlem sayısının 2'den fazla olması durumunda, t testi ile ikili karşılaştırmaların yapılması gerekir. Örneğin 4 işlem olduğunda 4'ün 2'li kombinasyonu kadar (4C2=6) karşılaştırma yapmak gerekir. işlem sayısı arttıkça karşılaştırma sayısı çok daha fazla olacaktır. Bu nedenle 2'den fazla karşılaştırmayı aynı anda yapan varyans analizi tekniği 1925'de Fisher tarafından geliştirilmiştir.

14 ANOVA F DAĞILIMI İstatistikte önemli sürekli bir dağılımda F – dağılımıdır. Aynı normal populasyondan çekilen veya aynı varyanslı normal populasyonlardan çekildiği varsayılan iki örnekten hesaplanan varyansların birbirine oranının 1’e eşit olması beklenir. Fakat bu her zaman gerçekleşmez ve bir dağılım gösterir. Bu oranların dağılımı F-dağılımı olarak bilinir. Sıfır ile + sonsuz değişim gösteren bir dağılımdır. F = S 1 2 / S 2 2

15 ANOVA Post Hoc ve Schefe Testleri; Anlamlı bir farklılığın bulunduğu durumda bu anlamlı farklılığın hangi sınıflar arasında olduğunu bulmak için ise Post Hoc veya Schefe testlerinin kullanılması gerekmektedir. Kolmogorow Smirnow ve Shapiro Wilkis Testleri; Parametrik testlerin kullanılmasının ön koşulu verilerin normal dağılıma sahip olması ve varyans homojenliği olduğundan, bunu ölçmek için Kolmogorow Smirnow ve Shapiro Wilkis Testleri kullanılır. Levene Testi; Varyans homojenliği Levene testi ile ölçülmektedir. Levene testinde anlamlılık düzeyi 0,05’den büyük çıkarsa dağılımın varyans homojenliğini sağladığı, küçük çıkarsa sağlamadığı bilinmelidir.

16 ANOVA ANOVA ile toplam değişmeye katkıda bulunan çeşitli değişim kaynaklarının değişkenler arası etkileşimi ve deneysel hataları incelenir. Varyans Analizinin Çeşitleri; Tek Yönlü Varyans Analizi (Bağımsız Örneklem/ İlişkili Örneklem) İki Yönlü Varyans Analizi (Bağımsız Örneklem/ İlişki Örneklem)

17 ANOVA TEK YÖNLÜ VARYANS ANALİZİ Tek yönlü varyans analizi n bağımsız grup denemelerinden elde edilen nicel verilerin analizinde yararlanılan bir yöntemdir. Diğer bir deyişle, İkiden çok bağımsız grup verilerinin değerlendirilmesinde tek yönlü varyans analizi kullanılır. Buradaki tek yön ifadesi, grupları birbirinden ayıran tek özellik olduğu, ya da grupların tek değişkeninin değerleri ile ayrıldığı anlamına gelir.

18 ANOVA Tek Yönlü Varyans Analizi Örneği 4 ayrı öğretim yönteminin her birinin 4 farklı öğrenci grubuna uygulanması. Sonuçlarına göre, hangi yönetimin daha etkin olduğunun anlaşılması. Yöntemler arasında etkinlik yönünden bir fark olup olmadığını belirlemek için Varyans Analizi kullanılır. Burada, 4 ayrı grubun ortalamaları karşılaştırılır.

19 ANOVA Bağımsız Örneklem Tek Yönlü Varyans Analizi 2’den fazla grubun ortalamaları karşılaştırılır. Örneğin evlilik hakkındaki görüşlerin medeni duruma (evli, bekar, dul) göre farklılık gösterip göstermediğini test etmek için İlişkili Örneklem Tek Yönlü Varyans Analizi Eşleştirilmiş örneklem t ‐ testini kullanarak; belirli bir değişkene ait deney öncesi ve sonrası değerleri karşılaştırabiliriz. Ölçüm sayısının ikiden fazla olduğu durumlar da ise İlişkili Örneklem Tek Yönlü Varyans Analizi yöntemini kullanabiliriz. Örneğin; bir ilacın etkilerini ölçmek için ikişer hafta arayla yapılan dört farklı testin sonuçları

20 ANOVA İKİ YÖNLÜ VARYANS ANALİZİ Bir iki yönlü ANOVA’da, iki faktörün etkileri eşanlı olarak incelenebilir. İki yönlü ANOVA aynı zamanda, her faktörün tek başına ve iki faktörün bir arada etkilerinin incelenmesine imkan vermektedir. Popülasyon ortalaması üzerindeki her faktörün tek başına olduğu düzeylere bağlanabilecek etkiye temel etki denir. İki faktör arasındaki etkileşim etkisi herhangi iki faktör çiftinin toplam etkisi iki temel etkinin toplamından önemli ölçüde farklılaştığında ortaya çıkar. Etkileşimde bulunmayan faktörler toplanabilir olarak adlandırılır.

21 ANOVA Bağımsız Örneklem İki Yönlü Varyans Analizi Belli bir bağımlı değişken üzerinde (Örneğin, öğretmenlerin performansı), birden fazla bağımsız değişkenin (örneğin, öğretmenlerin cinsiyeti ve kıdemi) ortak etkisini ölçmek için kullanılır. İlişkili Örneklem İki Yönlü Varyans Analizi Bir ilacın etkilerini ölçmek için ikişer ay arayla yapılan dört farklı testin sonuçlarını İlişkili Örneklem Tek Yönlü Varyans Analizi yöntemini kullanarak karşılaştırabiliriz. Bu ilaçların etkilerinin deneklerin cinsiyetlerine göre farklılık gösterip göstermediğini bulmak istersek ilişkili örneklem iki yönlü varyans analizini kullanmamız gerekmektedir.

22 ANOVA İki yönlü ANOVA ile cevaplanabilecek üç soru: A faktörünün herhangi bir temel etkisi var mı? B faktörünün herhangi bir temel etkisi var mı? A ve B faktörleri arasında herhangi bir etkileşim var mı? Örneğin, Tatilcilerin oyları üzerindeki etkileri beş farklı resort(Faktör A)a ve dört değişik resort niteliği (Faktör B) bakarak araştırabiliriz. Beş A faktörü temel düzeyi ve 4 B faktörü temel düzeyine ek olarak (5*4=20) etkileşim düzeyi bulunmaktadır.

23 MANOVA Tek değişkenli analizlerde araştırmadaki tüm değişkenlerin etkilerinin sabit kabul edilmekte ve her defasında sadece tek bir faktörün analizi yapılmaktadır. Fakat yapılan araştırmalar ve incelemeler sadece tek bir faktörün etkisiyle değil bir çok faktörün etkisi ile oluşmakta ve karmaşık bir yapı göstermektedir. Ancak herhangi bir araştırmada değişken sayıları birden fazla olduğu durumlarda tek değişkenli varyans analizini kullanmak yeterli olmamakla birlikte işlemlerin uzun sürmesine ve daha çok hatanın olmasına sebep olur. Bundan dolayı tek değişkenli analiz yerine çok değişkenli analizin kullanılması daha doğru olmaktadır.

24 MANOVA Çok değişkenli istatistiksel analiz, incelenen olay ve araştırmada çevresindeki bir çok sayıda iç ve dış faktörleri dikkate alarak, problemin yapısındaki bilgilere göre incelemek ve çözümlere ulaşmak için geliştirilmiş yöntemler bütünüdür. Çok değişkenli teknikler kolayca görülmesi çok güç olan karmaşık ilişkileri açıklar.

25 MANOVA Eğer birden fazla bağımlı değişkenin (performans, tatmin düzeyi, başarı notu vb.), birden fazla bağımsız değişken (cinsiyet, gelir düzeyi, mezun olunan okul vb.) göre farklılaşma durumunu aynı anda incelememiz gerekiyorsa çok faktörlü varyans analizi yöntemini kullanmamız gerekir. Birden çok bağımlı değişkeni eş zamanlı olarak incelemek istediğimizde MANOVA kullanılır. MANOVA’da bir veya daha fazla bağımlı değişken analiz edilebilir, bağımsız değişkenler arasındaki etkileşimler gözlenebilir, hangi grup ya da grupların diğerlerinden farklı olduğunu görmek için karşılaştırmalar yapılabilir.

26 MANOVA Örneğin, bilişsel davranış tedavisinin saplantı hastalığı (obsesif kompulsif disorder) üzerine etkileri. Bir grup hastaya davranış tedavisi, bir grup hastaya bilişsel davranış tedavisi uygulansın. Bir grup da kontrol grubu olsun. Tedavi sonucu hastaların hem saplantıyla ilgili davranışlarında hem de düşüncelerinde azalma beklenir (iki bağımlı değişken).

27 MANOVA Hipotezlerin tek değişkenli ve çok değişkenli test sonuçları aynı olmayabilir. Örneğin; değişkenler tek tek test edildiğinde hipotez tüm değişkenler için kabul edildiği halde, birden fazla değişken birlikte MANOVA ile test edildiğinde bu hipotezler reddedilebilir. Bunun sebebi; Tek değişkenli varyans analizi yapıldığında hata terimi bir tanedir. Ancak MANOVA ile analiz yapıldığında değişken sayısı ile birlikte analize dahil olan hata terimlerinin de sayısı artmış olacak ve analizdeki hata büyüyecektir. Bu durumdan dolayı; ANOVA ve MANOVA analizlerinin sonuçları arasında fark olabilir.

28 MANOVA Manova’nın diğer test tekniklerine göre en belirgin farklılığının bağımlı değişken sayısının 1’den fazla olmasıdır. Tek yönlü manova’da amaç, bir bağımsız değişkenin birden fazla bağımsız değişken üzerindeki etkisini incelemektir. İki yönlü manova’da amaç ise iki veya daha fazla bağımsız değişkenin 1’den fazla bağımlı değişken üzerindeki etkisini incelemektir. Örneğin, örencilerin bilgisayara sahip olmalarının, bilgisayar tutumlarına ve bilgisayar dersindeki başarılarına etkisini araştırmak isteyen bir araştırmacı Tek Yönlü Manova’yı kullanmalıdır. Eğer araştırmacı bağımsız değişkenler içine cinsiyeti de dahil ederse bu durumda kullanacağı teknik İki Yönlü Manova olmalıdır.

29 MANOVA Çok Değişkenli Analizlerde Kullanılan Test Yöntemleri Çok değişkenli analizlerde ortalama vektörleri arasında fark olup olmadığını incelemekte kullanılan birçok test yöntemi vardır. Bu test yöntemlerine çoklu karşılaştırma testleri denir. Bu testlere ait istatistikleri farklı dağılımlara sahiptir. Ancak bu istatistikler F istatistiğine dönüştürülebilir. İstatistik yazılımlarının çoğu bu istatistiklere ilişkin sonuçları vermektedir.

30 MANOVA Wilks Lamda İstatistiği Bu yöntem Genelleştirilmiş Olabilirlik Oranına dayalıdır. Bu test istatistiği 0–1 arasında değer alır. Lamda değeri sıfıra yaklaştıkça H 0 hipotezi reddedilir, 1’e yaklaştıkça H 0 hipotezinin kabul edilir. Araştırmaya konu olan değişkenler için gruplar arasında fark olup olmadığı Wilks Lamda istatistiği ile belirlenir. Bunun için yapılacak olan MANOVA analizinin sonucunda gruplar arasında bir fark varsa grup ortalamalarını eşit olmadığı, şayet anlamlı bir fark bulunmazsa tüm grup ortalamalarının eşit olduğu yani gruplar arasında fark olmadığı söylenebilir. Varyans analizinde Genel Kareler Toplamı = Gruplar Arası KT + Grup İçi KT şeklinde verilen eşitlik, çok değişkenli varyans analizinde matrislerle ifade edilir.

31 MANOVA Hotelling-lawley İz İstatistiği Hotelling T 2 testi çok değişkenli normal dağılım varsayımına göre kurulan çok değişkenli hipotezlerin test edilmesini amaçlayan bir yöntemdir. Hotelling Student t’nin çok değişkenli genellemesi olan T 2 istatistiğinin önemliliğini değerlendirmek için bir dağılım ortaya koymuştur ve bu dağılım çok değişkenli hipotezlerin test edilmesinde kullanılmaktadır. T 2 testi tek değişkenli hipotezlerin test edilmesinde yaralanılan t testinin çok değişkenli hipotezler için genellenmiş biçimidir

32 MANOVA Roy’un En Büyük Karakteristik Kök Kriteri En büyük özdeğer λ max ile gösterilirse, Roy’un En Büyük Öz Değer’e dayalı test istatistiği, θ = λ max / (1+ λ max ) ile gösterilir. θ de 0 ile 1 arasında değer alır. Çok Değişkenli Tek Faktör Varyans Analizi’nde iWBλ−−1 = 0 determinant değerinden elde edilen p tane öz değerden en büyüğü seçilir ve bu değerden test istatistiği θ elde edilir. Burada B gruplar arası kareler ve çarpımlar toplamı matrisi, W ise gruplar içi kareler ve çarpımlar toplamı matrisidir. θ nın 1’e yaklaşması H 0 hipotezinin reddedileceğini gösterir.

33 MANOVA Pillai İz Kriteri Test İstatistiği Testin incelenmesinde Roy’un Kök Yöntemi’ndeki gibi S, M ve Y parametreleri bulunur. Daha sonra test istatistiği Heck grafiğinden yararlanarak bulunan tablo değerleriyle karşılaştırılır. Bu test istatistikleri içinde Roy tarafından geliştirilen En Büyük Karakteristik Kök istatistiğinin ayrıcalıklı yeri vardır. En Büyük Kök istatistiği basit kombinasyonların fonksiyonunun hipotezinde daha güçlüdür ve en büyük karakteristik kök en dar güven aralığını vermektedir.

34 MANOVA Kİ KARE TESTİ Sayısal olmayan değişkenler (Medeni durum- evli/bekar/boşanmış/dul; meslek grubu- devlet memurluğu/ serbest meslek/ işçi) arasında herhangi bir ilişkinin olup olmadığını sıfır hipotezi ile ileri sürerek, bu hipotezin reddedilip edilemeyeceğinin incelenmesinde Kİ KARE TESTİ uygulanır.

35 MANOVA Ki ‐ kare Uyum İyiliği (Uygunluk) Testi Ki ‐ kare uygunluk testi ile belirli bir değişkenin farklı kategorilerine ait gözlenen frekanslarının, beklenen frekanslarına uygunluğu araştırılır. Burada beklenen frekanslar birbirine eşit olabileceği gibi farklı da olabilir. Örneğin, 2007 Ocak ayında yapılan ölümlerde, Beşiktaş ilçesi sakinlerinin % 30’unun NTV, % 25’inin CNN Türk, % 45’inin ise SKY Türk kanalını tercih ettiği belirlenmiştir. Acaba bu ölçümler 2007 Kasım ayı içinde geçerliliğini korumakta mıdır?

36 MANOVA Ki ‐ kare Bağımsızlık Testi İki değişken arasındaki ilişkinin istatistiksel olarak anlamlı olup olmadığını belirlemek amacıyla kullanılır. İlişki kurulan değişkenlerin her ikisi de Nominal (Sınıflama) ya da Ordinal (Sıralama) ölçeklidir. “Gelir düzeyi ile siyasi parti seçimi”, “eğitim düzeyi ile okunan gazete”, “iş tatmini düzeyi (evet, kısmen, hayır) ile ücret” değişkenleri arasındaki ilişkiler ki kare bağımsızlık testi ile incelenebilir.

37 KAYNAKLAR Çiğdem Uzun, Bilimsel Araştırma Yöntemleri, Tek Yönlü Varyans Testi Burcuhan BİÇKİCİ, ÇOK DEĞİŞKENLİ VARYANS ANALİZİ VE ÇOKLU DOĞRUSAL REGRESYON ANALİZİNİN UYGULAMALI OLARAK KARŞILAŞTIRILMASI Büyüköztürk, Sosyal Bilimler İçin Veri Analizi El Kitabı Yaşar Tonta, Varyans Analizi (ANOVA)- Çoklu Varyans Analizi (MANOVA) Güleda Düzyol, SPSS Uygulama I ‐ II, Parametrik/Nonparametrik Testler U. Erman EYMEN, SPSS 15.0 Veri Analiz Yöntemleri


"ANOVA / MANOVA MODEL OLUŞTURMA VE VERİ ANALİZİ 2011 Bahar Irmak Çağlı Sennur Ulugönül Merve Bölükbaşı." indir ppt

Benzer bir sunumlar


Google Reklamları