ANOVA ANALİZİ & KÜMELEME ANALİZİ THY UYGULAMASI

Slides:



Advertisements
Benzer bir sunumlar
Bölüm 5 Örneklem ve Örneklem Dağılımları
Advertisements

Kütle varyansı için hipotez testi
GİRİŞ BÖLÜM:1-2 VERİ ANALİZİ YL.
Sosyal Bilimlerde Araştırma Yöntemleri
BAĞIMSIZ ÖRNEKLEMLER İÇİN T TESTİ
İKİ ÖRNEKLEM TESTLERİ.
BAĞIMLI GRUPLARA İLİŞKİN HİPOTEZ TESTLERİ
Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ
BAĞIMSIZ GRUPLARDA İKİ ÖRNEKLEM TESTLERİ
VARYANS ANALİZİ İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden.
TEK YÖNLÜ VARYANS ANALİZİ
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
THY SPSS UYGULAMASI 1.SORU:Kİ-KARE ANALİZİ
Kİ-KARE TESTİ Uygulama amacına ve durumuna göre Ki-Kare Testi üç başlık altında incelenir; Ki-Kare Uygunluk Testi Ki-Kare Bağımsızlık Testi Ki-Kare Homojenlik.
ANOVA.
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
Eşleştirilmiş Örnekleme T-testi
Yrd. Doç. Dr. Kemal DOYMUŞ K.K.E.F İlköğretim Bölümü
ANOVA (ANalysis Of Varyans)
PARAMETRİK HİPOTEZ TESTLERİ
Veri Toplama, Verilerin Özetlenmesi ve Düzenlenmesi
Soruya geri dön
İki Eş Arasındaki Farkın Önemlilik Testi
ARALARINDA ASAL SAYILAR
1. İki Yönlü ANOVA İki bağımsız değişkenin bir bağımlı değişken üzerine etkisini araştırırken bağımsız değişkenlerin bağımlı değişken üzerine etkilerini.
Tam sayılarda bölme ve çarpma işlemi
Deneysel Yöntem İstatistiksel Yöntemler
PARAMETRİK ANALİZ TEKNİKLERİ
Prof. Dr. Hüseyin BAŞLIGİL
HABTEKUS' HABTEKUS'08 3.
ÖNEMLİLİK TESTLERİ Dr.A.Tevfik SÜNTER
THY ANALİZLERİ Ki – Kare Testi
SİU 2009 Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler Ethem Alpaydın Boğaziçi Üniversitesi
T- TEST BAĞIMSIZ İKİ GRUP T-TESTİ
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
Diferansiyel Denklemler
DENEY TASARIMI VE ANALİZİ (DESIGN AND ANALYSIS OF EXPERIMENTS)
(Enter ve Stepwise Yöntemi)
THY Örneği Verilerin Diskriminant Analizi İle Açıklanması
Çocuklar,sayılar arasındaki İlişkiyi fark ettiniz mi?
RASYONEL SAYILARLA TOPLAMA ve ÇIKARMA İŞLEMLERİ
TEK YÖNLÜ MANOVA Birden fazla bağımlı değişkene tek bir bağımsız değişkenin etki ettiği durumlarda Tek Yönlü MANOVA kullanılır. Tek yönlü MANOVA da başlangıç.
T - Testi Bağımsız örneklem t – Testi, bir birinden farklı örneklemlerin ölçülen ortalaması ile tahmin edilen ya da bilinen ortalamasının karşılaştırtırılmasında.
Neden İki Faktörlü Anova Yapıyoruz?
Kİ-KARE TESTİ Uygulama amacına ve durumuna göre Ki-Kare Testi üç başlık altında incelenir; Ki-Kare Uygunluk Testi Ki-Kare Bağımsızlık Testi Ki-Kare Homojenlik.
1.HAFTA 26 Ağustos 2009 ÇARŞAMBA 2.HAFTA 01 EYLÜL 2009 SALI 3.HAFTA 09 EYLÜL 2009 ÇARŞAMBA 4.HAFTA 15 EYLÜL 2009 SALI 5.HAFTA 23 EYLÜL 2009 ÇARŞAMBA 6.HAFTA.
1.HAFTA 26 Ağustos 2009 ÇARŞAMBA 2.HAFTA 01 EYLÜL 2009 SALI 3.HAFTA 09 EYLÜL 2009 ÇARŞAMBA 4.HAFTA 15 EYLÜL 2009 SALI 5.HAFTA 23 EYLÜL 2009 ÇARŞAMBA 6.HAFTA.
Diferansiyel Denklemler
VARYANS ANALİZİ Varyans analizi iki yada daha fazla ortalama arasında fark olup olmadığı ile ilgili hipotezi test etmek için kullanılır. Varyans analizinde.
THY Uygulaması Araştırması
KRUSKAL WALLIS VARYANS ANALİZİ
İKİ YÖNLÜ MANOVA Birden fazla bağımlı değişkene iki bağımsız değişkenin etki ettiği durumlarda Çift Yönlü MANOVA kullanılır. Çift yönlü MANOVA da başlangıç.
Yrd. Doç. Dr. Hamit ACEMOĞLU
Bilişim Teknolojileri için İşletme İstatistiği
İstatistik-3 Prof.Dr. Cem S. Sütcü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D. cemsutcu.wordpress.com.
Parametrik Hipotez Testleri
İKİ ÖRNEKLEM TESTLERİ Mann_Whitney U
Çıkarsamalı İstatistik Yöntemler
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
OLASILIK ve İSTATİSTİK
NON-PARAMETRİK TESTLER Doç. Dr. Kemal DOYMUŞ K.K.E.F İlköğretim Bölümü.
Merkezi Eğilim Ölçüleri
VARYANS VE KOVARYANS ANALİZLERİ
Numerik Veri Tek Grup Prof. Dr. Hamit ACEMOĞLU.
VARYANS ANALİZİ Varyans analizi iki yada daha fazla ortalama arasında fark olup olmadığı ile ilgili hipotezi test etmek için kullanılır. Varyans analizinde.
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
İletişim Fakültesi Bilişim A.B.D.
Sunum transkripti:

ANOVA ANALİZİ & KÜMELEME ANALİZİ THY UYGULAMASI Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın Mayıs 09

ANOVA – VARYANS ANALİZİ T-testi ile iki ortalamanın karşılaştırmasını yapılır. İkiden fazla kitle ortalaması arasında fark olup olmadığının test edilmesi için ise Anova analizi kullanılır. H0: µ1 = µ2 =…= µk (Yani ortalamalar arasında fark yoktur.) H1 : ortalamalardan en az ikisi arasında anlamlı fark vardır.

BAĞIMSIZ DEĞİŞKEN SAYISI Bağımlı değişken sayısı ANOVA – VARYANS ANALİZİ Varyans analizinde de bağımlı ve bağımsız değişkenler bulunur. Bağımsız değişkenlerin, bağımlı değişken üzerindeki etkisi araştırılır. Kullanılan yöntemler: BAĞIMSIZ DEĞİŞKEN SAYISI BİR İKİ Bağımlı değişken sayısı Tek yönlü ANOVA İki yönlü ANOVA BİRDEN FAZLA Tek yönlü MANOVA İki yönlü MANOVA

ANOVA – VARYANS ANALİZİ Gerekli parametreler: Toplam örnek gözlem sayısı Bütün gözlemlerin ortalaması

ANOVA – VARYANS ANALİZİ Gerekli parametreler: Kareler toplamı: 1. Gruplar arası kareler toplamı (within groups) MST = Mean Square Between Groups = SST (sum of squares) df ( number of groups -1)

ANOVA – VARYANS ANALİZİ Gerekli parametreler: Kareler toplamı: 2. Grup içi kareler toplamı (between groups) MSE = Mean Square Within Groups (MS error) = SSE (sum of squares within groups) df ( total sample size –no. of groups)

ANOVA – VARYANS ANALİZİ MST ve MSE değerleri ile 2 varyans tahmini elde edilir. Ho doğru ise bu iki değer de yaklaşık eşit olmalıdır. Ho doğru değilse; MST, MSE’den büyük olmalıdır. F değeri hesaplanır: F = MST MSE F dağılım tablosundan serbestlik derecesi değerlerine göre CVF değeri bulunur. Eğer F > CVF ise Ho red edilir. Yani ortalamalar arasında farklılık yoktur.

SORU: 9 THY yolcularının yaş gruplarını (v9) dikkate alarak beklentilere yönelik hizmet kalitesine ait (v601) ve (v602) değişkenlerini ANOVA analizi ile test ediniz. İkili karşılaştırmaları Scheffe ile yaparak sonuçlarını yorumlayınız. (v601): Modern ekipmana sahip olmalıdır. (v602): Uçakların iç ve dış görünümü çekici olmalıdır.

ARAŞTIRMA MODELİ Sosyo- demografik Beklenen özellikler hizmet Yaş grubu ile Uçakların iç-dış görünümünün çekici olmasına yönelik beklenti. Sosyo- demografik özellikler Tüketim Alışkanlıkları Beklenen hizmet Algılanan hizmet kalitesi Tatmin Tüketicilerin sosyo-demografik özellikleri ve tüketim alışkanlıkları

AMAÇ: Yaş grupları arasında (demografik özellik) beklenen hizmet kalitesinde fark olup olmadığını inceleyeceğiz. 6 tane yaş grubunun (v601) ve (v602) değişkenlerindeki ortalamaları karşılaştırılacağı için tek yönlü varyans analizini kullanacağız.

HİPOTEZ: Ho: “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 H1 : “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır. Ho: “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 H1 : “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır.

df = grup sayısı -1 = 6-1 = 5 MST= SST / df =2,450 / 5 = 0,490

df = N –grup sayısı = 511-6 = 505 MSE = SSE / df =137,981 / 505 =0,273

F = MST / MSE = 0,490 / 0,273 = 1,793 F dağılımı (5, 505)

% 95 güven aralığı; F (5, 505) için F dağılımı tablosuna bakarsak; 2,21

Ho: “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 Ho red alanı Ho kabul alanı 2,21 1,793 F dağılımı (5, 505) = 2,21 Ho kabul edilir

F = MST / MSE = 1,613 / 0,538 = 2,995 F dağılımı (5, 505)

H1 : “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır. Ho red alanı Ho kabul alanı 2,21 2,995 Ho red, H1 kabul edilir. F dağılımı (5, 505) = 2,21

Sonuçlar: Bu örnekte; tek yönlü ANOVA (Varyans Analizi) yapılmıştır. İki bağımlı değişkenlerin her biri ayrı ayrı bağımsız değişken ile analize girmiştir bundan dolayı sonuçlar da ayrı ayrı değerlendirilmelidir. Burada tek yönlü MANOVA’ da yapılabilirde ama o zaman bağımlı değişkenler birlikte gözetilerek, bağımsız değişken ile analize tabi tutulmuş olurdu. Descriptes tablosuna baktığımızda 0.05 güven aralığı ile çalışıldığı görülmektedir. Bunun için ANOVA tablosundaki “significant değeri” 0.05 ile karşılaştırılır yada “Ft” değerleri bulunarak ANOVA tablosundaki “F” değerleri ile karşılaştırılır.

Sig= 0.113 > 0.05 Ho kabul FT 5, 505;0.05=2.21>1.79= FH Ho Kabul Grup ortalamaları arasında fark yok. Yaş gruplarına göre bir uçağı modern ekipmana sahip olması değişmemektedir. Sig= 0.011< 0.05 Ho red FT 5,505;0.05 =2.21<2.995=FH Ho red Grup ortalamaları arasında fark var. Uçakların iç ve dış görünümünün çekici olması yaş gruplarına göre farklılık göstermektedir. Peki farklılık hangi grup ya da gruplardan kaynaklanıyor? Scheffe yöntemi ile tek tek eşleştirmeleri inceleyerek bu farklılığın anlamlı bir farklılık olup olmadığına bakacağız. Ortalamalar arasındaki farkı F tablosunu da kullanarak kıyaslayacağız.

Bu ortalamanın diğer ortalamalardan farkı hesaplanır Multiple Comparisons:Scheffe Dependent Variable (I) Yaş (J) Yaş Mean Difference(I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound Uçakların iç ve dış görünümü çekici olmalıdır 18-24 25-34 -0,269 0,160 0,724 -0,802 0,264   35-44 -0,377 0,157 0,330 -0,901 0,147 45-54 -0,444 0,163 0,193 -0,988 0,100 55-64 -0,490 0,179 0,186 -1,087 0,107 65 ve üstü -0,740 0,245 0,106 -1,558 0,078 0,269 -0,264 0,802 -0,108 0,084 0,893 -0,388 0,172 -0,175 0,094 0,636 0,141 -0,221 0,120 0,637 -0,620 0,178 -0,471 0,206 0,390 -1,159 0,217 0,377 -0,147 0,901 0,108 -0,172 0,388 -0,067 0,090 0,990 -0,367 0,233 -0,113 0,116 0,966 -0,500 0,274 -0,363 0,204 0,674 -1,044 0,318 0,444 -0,100 0,988 0,175 -0,141 0,490 0,067 -0,233 0,367 -0,046 0,124 1,000 -0,460 -0,296 0,208 0,846 -0,993 0,400 -0,107 1,087 0,221 -0,178 0,620 0,113 -0,274 0,500 0,046 0,460 -0,250 0,937 0,488 0,740 -0,078 1,558 0,471 -0,217 1,159 0,363 -0,318 1,044 0,296 -0,400 0,993 0,250 -0,488 Örn; 18-24 yaş için ort 3,76 iken Bu ortalamanın diğer ortalamalardan farkı hesaplanır

Anlamlılık düzeyine baktığımızda; Multiple Comparisons:Scheffe Dependent Variable (I) Yaş (J) Yaş Mean Difference(I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound Uçakların iç ve dış görünümü çekici olmalıdır 18-24 25-34 -0,269 0,160 0,724 -0,802 0,264   35-44 -0,377 0,157 0,330 -0,901 0,147 45-54 -0,444 0,163 0,193 -0,988 0,100 55-64 -0,490 0,179 0,186 -1,087 0,107 65 ve üstü -0,740 0,245 0,106 -1,558 0,078 0,269 -0,264 0,802 -0,108 0,084 0,893 -0,388 0,172 -0,175 0,094 0,636 0,141 -0,221 0,120 0,637 -0,620 0,178 -0,471 0,206 0,390 -1,159 0,217 0,377 -0,147 0,901 0,108 -0,172 0,388 -0,067 0,090 0,990 -0,367 0,233 -0,113 0,116 0,966 -0,500 0,274 -0,363 0,204 0,674 -1,044 0,318 0,444 -0,100 0,988 0,175 -0,141 0,490 0,067 -0,233 0,367 -0,046 0,124 1,000 -0,460 -0,296 0,208 0,846 -0,993 0,400 -0,107 1,087 0,221 -0,178 0,620 0,113 -0,274 0,500 0,046 0,460 -0,250 0,937 0,488 0,740 -0,078 1,558 0,471 -0,217 1,159 0,363 -0,318 1,044 0,296 -0,400 0,993 0,250 -0,488 Anlamlılık düzeyine baktığımızda; tüm değerler 0,05’ten büyük olduğu için gruplar arasında anlamlı bir farkın olmadığı görülür.

Sonuçlar: Sig= 0.725 > 0.05 bu iki yaş grubu arasında önemli bir farklılık gözlenmediği söylenir. Tablo incelendiğinde yaş bağımsız değişkenlerinde, her iki bağımlı değişken için ortalamalar arası farklar anlamlı çıkmamıştır. Uçakların iç ve dış görünümünün çekiciliği gruplara göre ANOVA’da farklılık gösterse de hangi gruptan kaynaklandığı görülmemiştir çünkü Scheffe’ye göre gruplar arasındaki fark %95 anlamlılık düzeyinde anlamlı değildir.

Homogeneous Subsets Alt Grup Tablosuna da baktığımızda alt gruplara ayrılma yapılmadığını yani grupların modern ekipmana sahip olma ve uçakların iç ve dış görünümünün çekici olması konusunda benzer özellik gösterdiğini tekrardan görmekteyiz. Scheffe ile tek tek eşleştirmeler incelendiğinde, “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesi için gruplar arası anlamlı bir farklılık %95 güven aralığında gözlenmemektedir.

KÜMELEME ANALİZİ - Cluster Analysis Gruplanmış verileri birey ya da nesnelere temel özelliklerine dikkate alarak sınıflandırmada sıklıkla kullanılan çok değişkenli istatistiksel bir yöntemdir. Kümeleme analizi bize özetleyici bilgileri sunmaktadır. Analiz sonucunda oluşan kümeler arasında heterojenlik, kümelerin kendi içlerinde homojenliği yüksektir.

KÜMELEME ANALİZİ - Cluster Analysis Kümeleme analizinde değişkenler bağımlı ve bağımsız olarak ikiye ayrılmamaktadır. Kümeleme analizi şunlar için kullanılabilir; Bir araştırmada gözlem sayımız çok fazla olduğu zaman kümeleme sayesinde analizin yapılmasını ve verilerin yorumlanmasını kolaylaştırır. Bazen araştırmacılar varsayım geliştirmek ya da varsayımlarını önceden test etmek istediklerinde kullanırlar.

SORU: 10 THY verilerini dikkate alarak faktör analizi sonucu elde edilen boyutlara göre ((Güvenilir1), (Müsteri1), (Anindahizmet1), (Güventelkinetme1), (Fizikiunsurlar1)) kümeleme analizini yapınız. Kümeleme analizinde k-ortalamalar yöntemini (k=3) kullanınız. Elde edilen kümelerin faktörler itibariyle farklılıklarının anlamlı olup olmadığını LSD (Least Significance Difference) testi ile inceleyerek yorumlayınız.

ARAŞTIRMA MODELİ Sosyo- demografik Beklenen özellikler hizmet Tüketim Alışkanlıkları Beklenen hizmet Algılanan hizmet kalitesi Tatmin Tüketicilerin sosyo-demografik özellikleri ve tüketim alışkanlıkları

AMAÇ: Hizmet algısını ölçmek için hazırlanan değişkenleri Faktör analizi ile 5 faktörde toplamıştık. Bu faktörlere kümeleme analizi uygulayıp benzer özellik gösterenleri belirleyeceğiz ve küme farklılıklarının anlamlı olup olmadığına bakacağız. Faktörler: 1-Güvenilir ve doğru hizmet, 2-müşteriyi tanıma ve anlama, 3-anında hizmet, 4-güven telkin etme, 5-fiziki unsurlar. 29 29

İlk kümeleme merkezi; Üç kümeleme olduğu belirtildiği üzere Tekrarlamayı Running Means seçsek de 5 tekrarlamada 3 kümelenin oluştuğunu görülmekte. Değerler neredeyse sıfır artık bu değişim bitti demektir.

Final Cluster Centers tablosuna baktığımızda, 5 değişkenin 3 kümedeki ortalamalarını verdiğini görüyoruz. Bütün bu değişkenlerden en çok zevk alan 1. kümedir Her kümeye isabet eden gözlem sayısını vermektedir. Kümeye 161 gözlem Kümeye 213 gözlem Kümeye 137 gözlem

ANOVA’da bütün değişkenlerin sig değerleri 0 ANOVA’da bütün değişkenlerin sig değerleri 0.05’ten küçük olduğu için Ho red yani kümelerin ortalamalar arası farkı anlamlıdır diyoruz. Zaten kümeleme ile bu fark kendiliğinden gelir, kümeler arası fark max yapılarak 3 kümeye indirgenmiştir. FT 2.508;0.05= 3 bu değer bütün FH’lardan küçük olduğu için Ho red edildiği buradan da söylenir.

Grupların tanımlayıcı istatistikleri:

1. Sig =0.000> 0.05 Ho red FT 2.508;0.05=3 < FH=186.665 Ho red 2,3,4,5 içinde aynı şeyler yapılır Ho red sonucu çıkar.

Sonuçlar: Güvenilir ve doğru hizmette sınıflar arası fark anlamlıdır. Müşteriyi tanıma anlama için sınıflar arası fark anlamlıdır. Anında hizmet için sınıflar arası fark anlamlıdır. Güven Telkin Etme için sınıflar arasındaki fark anlamlıdır. Fiziki unsurlar için sınıflar arası fark anlamlıdır.

Çoklu karşılaştırma tablosu

SONUÇLAR: Güvenilirlik ve Doğru Hizmet için 1. ve 2. grup arasında fark 1-2= I-J= 0.36724’tür. Sig= 0.049 <0.05 Bu iki grup arasında farklılık olduğu söylenir. Zaten SPSS programı aralarında farklılığın olduğu gruplara “*” işareti koymuştur. Güvenilirlik ve Doğru Hizmet için bütün gruplar birbirinden farklıdır. Müşteriyi Tanıma ve Anlama değişkeni için 1. grup 2.ve 3. gruptan farklılık göstermektedir. Anında Hizmet değişkeni için farklılığı gösteren 3. gruptur. Güven Telkin Etme değişkeni için farklılığı gösteren 3. gruptur. Fiziki unsurlar değişkeni için bütün gruplar birbirinden farklılık göstermektedir.

Nihai Küme Merkezleri sonucu, genel olarak, değişkenlere sırasıyla 1, 2, 3 daha fazla önem vermektedir. (1>2>3) ANOVA’da en yüksek değeri “Müşteriye Yakınlık” değişkeni aldığı için, bu özellik bakımından kümelemedeki ayrışmanın (birbirinden uzaklığın) diğerlerine kıyasla daha fazla olduğu görülmektedir. ANOVA sonucu tüm kümelerin birbirinden p=0.05 düzeyinde ortalamalar bakımından farklı oldukları görülmektedir. (H0 red: En az bir değişken diğerlerinden farklıdır) Daha detaylı bilgi için LSD yapılarak, hangi kümelerin değişkenler bazında birbirinden farklı olduğuna bakılır. Sonuç olarak “Hizmet ve Uçak Kalitesi” bakımından 1. ve 2. kümeler hariç diğer tüm kümelerin ortalamalarının farklı olduğu sonucuna varılır.

Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın Teşekkürler… Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın