ANOVA.

Slides:



Advertisements
Benzer bir sunumlar
Normal Dağılım Dışındaki Teorik Dağılımlar
Advertisements

Çıkarımsal İstatistik
Bölüm 5 Örneklem ve Örneklem Dağılımları
Kütle varyansı için hipotez testi
Sosyal Bilimlerde Araştırma Yöntemleri
İKİ ÖRNEKLEM TESTLERİ.
Kalibrasyon.
İstatistik Tahmin ve Güven aralıkları
Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ
R2 Belirleme Katsayısı.
VARYANS ANALİZİ İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden.
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
THY SPSS UYGULAMASI 1.SORU:Kİ-KARE ANALİZİ
Kİ-KARE TESTİ Uygulama amacına ve durumuna göre Ki-Kare Testi üç başlık altında incelenir; Ki-Kare Uygunluk Testi Ki-Kare Bağımsızlık Testi Ki-Kare Homojenlik.
Etkensel Deney Tasarımı
HİPOTEZ TESTLERİ.
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
Tanımlayıcı İstatistikler
Tıp alanında kullanılan temel istatistiksel kavramlar
İstatistikte Bazı Temel Kavramlar
Kısmi Etkensel Deney Tasarımı
Deneysel Yöntem İstatistiksel Yöntemler
Regresyonla Etkensel Deneylerin İncelenmesi
Hesaplanan Parametrelerin Hassasiyeti ve Güvenirlik Bölgesi
Prof. Dr. Hüseyin BAŞLIGİL
ÖNEMLİLİK TESTLERİ Dr.A.Tevfik SÜNTER
Değişkenlik Ölçüleri.
Büyük ve Küçük Örneklemlerden Kestirme
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
OLASILIK ve KURAMSAL DAĞILIMLAR
TANIMLAYICI İSTATİSTİKLER
İki Ortalama Farkının Test Edilmesi
Neden İki Faktörlü Anova Yapıyoruz?
Betimleyici İstatistik – I
KRUSKAL WALLIS VARYANS ANALİZİ
Kİ-KARE DAĞILIMI VE TESTİ
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
DEĞİŞKENLİK ÖLÇÜLERİ.
Yrd. Doç. Dr. Hamit ACEMOĞLU
Uygulama I.
HİPOTEZ TESTLERİNE GİRİŞ
Örneklem Dağılışları.
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
ÖĞRENME AMAÇLARI Veri analizi kavramı ve sağladığı işlevleri hakkında bilgi edinmek Pazarlama araştırmalarında kullanılan istatistiksel analizlerin.
Olasılık Dağılımları ve Kuramsal Dağılışlar
Örneklem Dağılışları ve Standart Hata
ANALİTİK YÖNTEM VALİDASYONU
İstatistik-3 Prof.Dr. Cem S. Sütcü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D. cemsutcu.wordpress.com.
12.HAFTA İÇERİK VARYANS ANALİZİ Giriş Tek Faktörlü Varyans Analizi
HİPOTEZ TESTLERİNE GİRİŞ
ÖĞRENME AMAÇLARI Pazar segmentasyon kararları için farkların nasıl kullanıldığını öğrenmek t testinin ve z testinin ne zaman kullanılması gerektiği.
İstatistik Tahmin ve Güven aralıkları
İSTATİSTİKTE TAHMİN ve HİPOTEZ TESTLERİ İSTATİSTİK
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
OLASILIK ve İSTATİSTİK
Lineer Regresyon. Amaç: Bu konu sonunda Tıp Fakültesi 1. sınıf öğrencilerinin çeşitli bağımsız değişkenleri kullanarak bir nümerik değişkenin değerini.
Numerik Veri İki Bağımsız Grup
Teorik Dağılımlar: Diğer Dağılımlar
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Merkezi Eğilim Ölçüleri
Numerik Veri Tek Grup Prof. Dr. Hamit ACEMOĞLU.
HİPOTEZ TESTLERİ.
t-STUDENT VE Kİ-KARE TESTİ
Uygulama I.
Hipotez Testinde 5 Aşamalı Model
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
1.Hafta Haftalık Çizelge Temel Kavramlar SPSS’ e giriş
Sunum transkripti:

ANOVA

K tane ortalamanın Karşılaştırılması: Varyans Analizi Varyansın analizi (ANOVA) iki ya da daha fazla örneklem ortalamalarının aynı gerçek ortalamaya sahip bir yığından elde edilip edilemeyeceğini belirlemek için yapılır. Varyansın karşılaştırılması F dağılımı kullanılarak gerçekleştirilir. F testi.

Varyans (Değişke) Analizi Örneklem varyanslarının dağılımı c2 dağılımına sahiptir. c2 dağılımları çarpık dağılımlar olup şekilleri serbestlik derecesine göre değişir. Aynı yığına ait normal dağılım gösteren iki örneklemin varyanslarının oranı da F dağılımına göre değişir.

c2 Dağılımı Normal Dağılım (z)  t dağılım (t test) c2 Dağılım  F dağılım (F test)

Tek Yönlü Varyans Analizi Eğer gruplar arasında sadece tek bir faktörün etkisine bakılacaksa tek yönlü varyans analizi yapılır. k farklı grup verisinin karşılaştıracağını varsayalım. Her grup için nt tane tekrar gözlem yapılmış olsun. Toplam gözlem sayısı N = Snt t = 1,2, 3, …k Her yöntem için tekrar ölçümler arasında rastsal bir değişkenlik olacaktır. Ancak bu, rastsal ölçüm hatalarından kaynaklanıyorsa sadece rastsal deney hatalarına ait yaklaşık bir değeri verecektir. k metodun farklı olup olmadığını anlamak için yöntemler arasındaki farklılığın incelenmesi gerekir.

Tek Yönlü Varyans Analizi Örneklem İçindeki Değişkenlik Örneklemler Arası

Tek Yönlü Varyans Analizi Her grubun varyans (st2): Tüm grupların aynı yığın varyansına sahip olduğunu varsayarak örneklem içi varyans (sw2)hesaplanır. Gruplar arası varyans ise grup ortalamaları ile toplam ortalamayı kullanarak hesaplanır. Her yöntemde eşit sayıda ölçüm varsa

Ho: k ortalama arasında fark yoktur Örneklemler içinde Örneklemler Arasında Eğer deney sonuçlarını etkileyen bilinmedik bir etken yoksa, sw2 sırf ölçüm hatalarından kaynaklanan varyans s2’nin yaklaşık değerini verir. Eğer yöntem ortalamaları arasında şans eseri beklenenin dışında bir fark yoksa yöntemler arası sb2 de sadece rastsal ölçüm hatalarını belirler. Böyle bir durumda sw2’ye eşit olması beklenir. s2’nin hesaplanmış ikinci bir yaklaşık değeridir. Eğer gerçek ortalama yöntemden yönteme fark gösteriyorsa sb2’nin değeri şişecek ve sw2’den yüksek olacaktır. Ho: k ortalama arasında fark yoktur Bunu anlamak için s2’nin iki tahmini değeri sw2 ve sb2 büyüklüğünün istatistiksel olarak aynı olup olmadığı kontrol edilir. Aynıysalar, ortalamanın farklı olduğuna dair güçlü bir kanıt yok diyebiliriz. Farklıysalar, yani sb2’nin değeri fazlaysa ortalamaların farklı olduğu sonucunu çıkarırız. Varyanslar arasında fark olup olmadığını ise F testi uygulayarak bilebiliriz.

Örnek A, B ve C metotlarının arasında bir fark olup olmadığı hakkında ne söylenebilir?

Örnek ? 6.06 52

6.06 52? Bu soruya yanıt vermek için F testi yapmalıyız: F dağılımı örneklem varyans oranının dağılımına ve serbestlik derecesine göre tabloya konmuştur. Pay örneklemler arası varyans, payda ise örneklemler içindeki varyanstır. Fv1,v2,a=F2,9,0.05=4.74 (Excel’de =FTERS(0.05;2;9)) Hesaplanan Fh = 52/6.06 = 8.67 Fh > Fk  sb2 >sw2. Yani üç yöntemden alınan ortalamalar eşit değil. Ancak hangisinin bu eşitliği bozduğunu bilemeyiz. Farklı olanı bulmak farklı bir yöntem gerektirir.

ANOVA Fonksiyonu Eğer ANOVAyı bir yazılım programı kullanarak yaparsanız, çoğunlukla aşağıdaki tabloya benzer bir ANOVA sonuç tablosu alırsınız. Excel’de ANOVA için Araçlar/veri çözümleme/ Tek etken Anova: Kareleri alınmış sapmaların Toplamı Serbestlik derecesine bölünmüş sapma kareleri toplamı Serbestlik Derecesi Fk Fh Fh değeri elde etme yüzdesi

Örnek Standart çözeltiden 50 alikot hazırlanıp 5 ayrı laboratuara gönderiliyor. Laboratuarların ölçümleri arasında bir fark olup olmadığı konusunda ne söylenebilir?

Şekilden görüldüğü gibi, sonuçlardaki değişkenlik her laboratuar için hemen hemen aynı. Lab 4 ve 5 toplam ortalamanın biraz daha altında sonuç veriyor. Tek bir laboratuardaki varyans rassal hatalardan (numune hazırlama ve analizde ortaya çıkan) kaynaklanır. Laboratuarlar arası varyans ise deney yapma sırasında gerçekten var olan bir farktan veya rastsal değişkenlikten oluşur. Eğer laboratuarlar arasındaki fark rastsal ise 5 laboratuardan alınan ortalama değerler toplam ortalama civarında rastsal olarak değişecektir ve 5 lab ortalamasının varyansı lab içindeki varyansla aynı olacaktır. Varyanslar aynı mı?

Fh >Fk 6.77 > 2.58  Bu durumda laboratuarlar arasındaki değişkenlik laboratuar içindeki değişkenlikten daha büyük. Yani laboratuarların ölçümleri arasında bir fark olduğunu söyleyebiliriz. Lab 4 hepsinden daha küçük bir ortalamaya sahip olduğundan diğerlerinden farklıdır sonucu çıkarılabilir. Ama 4 ve 5 diğer üçünden farklı olabilir. Laboratuar 3 en yüksek ortalamaya sahip olduğundan belki farklı olan odur.

NOT ANOVA birden fazla etkenin olduğu problemlere de uygulanabilir. ANOVA bize hangi laboratuarın ya da kaç laboratuarın farklı olduğunu söylemez, sadece onların aynı sonucu vermediği gerçeğini çıkarabiliriz. ANOVA’dan sonra diğer sorulacak sorular: Hangi lablar farklı hangileri aynı (Çoklu eşli karşılaştırma, güvenilirlik sınırları ile grafikle gösterme) Hangi lab doğru sonucu veriyor? (En yüksek ölçen belki de ne doğru ölçen.) ANOVA birden fazla etkenin olduğu problemlere de uygulanabilir.

Güvenirlik Sınırları ile Grafik Her bir labın ortalamasının %95 güvenirlik aralıği hesaplanarak grafikte gösterilebilir. Standart çözeltinin konsantrasyonu bilindiği takdirde hangi lablarda sorun olduğu belirlenebilir. Excelde Araçlar/Veri Çözümleme / Tanımlayıcı İstatistik (Özet istatistikler ve güvenirlik kutuları işaretli)

Güvenirlik Sınırları ile Grafik Excel’de Özet İstatistik Çıktısı

Güvenirlik Sınırları ile Grafik Standart değerin 4 olduğunu varsayarsak Lab 4 ve 5’in sorunlu olduğunu düşünebiliriz.

2 Etkenli Anova Farklı safsızlık dereceleri ve soğutma hızları ile sentezlenen kristallerin elektrik özellikleri ölçüldü. Safsızlık türünün önemli bir etkisi var mı? Soğutma oranı önemli bir etki gösteriyor mu?

Excel’de 2 faktörlü Anova Araçlar /Veri Çözümleme / Anova –Yinelemesiz Çift Etken

Anova Çıktısı

Sonuçların Yorumlanması Satırlar: Safsızlık Tipi F >Fk, p < 0.05 Sıfır hipotezini reddet, yani safsızlık tipinin etkisi anlamlı Sütunlar: Soğutma Hızı F < Fk , p > 0.05 Sıfır hipotezini kabul edilir, yani soğutma hızı kristalin elektriksel özelliklerinde anlamlı bir etkiye neden olmamakta