ANOVA ANALİZİ & KÜMELEME ANALİZİ THY UYGULAMASI Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın Mayıs 09
ANOVA – VARYANS ANALİZİ T-testi ile iki ortalamanın karşılaştırmasını yapılır. İkiden fazla kitle ortalaması arasında fark olup olmadığının test edilmesi için ise Anova analizi kullanılır. H0: µ1 = µ2 =…= µk (Yani ortalamalar arasında fark yoktur.) H1 : ortalamalardan en az ikisi arasında anlamlı fark vardır.
BAĞIMSIZ DEĞİŞKEN SAYISI Bağımlı değişken sayısı ANOVA – VARYANS ANALİZİ Varyans analizinde de bağımlı ve bağımsız değişkenler bulunur. Bağımsız değişkenlerin, bağımlı değişken üzerindeki etkisi araştırılır. Kullanılan yöntemler: BAĞIMSIZ DEĞİŞKEN SAYISI BİR İKİ Bağımlı değişken sayısı Tek yönlü ANOVA İki yönlü ANOVA BİRDEN FAZLA Tek yönlü MANOVA İki yönlü MANOVA
ANOVA – VARYANS ANALİZİ Gerekli parametreler: Toplam örnek gözlem sayısı Bütün gözlemlerin ortalaması
ANOVA – VARYANS ANALİZİ Gerekli parametreler: Kareler toplamı: 1. Gruplar arası kareler toplamı (within groups) MST = Mean Square Between Groups = SST (sum of squares) df ( number of groups -1)
ANOVA – VARYANS ANALİZİ Gerekli parametreler: Kareler toplamı: 2. Grup içi kareler toplamı (between groups) MSE = Mean Square Within Groups (MS error) = SSE (sum of squares within groups) df ( total sample size –no. of groups)
ANOVA – VARYANS ANALİZİ MST ve MSE değerleri ile 2 varyans tahmini elde edilir. Ho doğru ise bu iki değer de yaklaşık eşit olmalıdır. Ho doğru değilse; MST, MSE’den büyük olmalıdır. F değeri hesaplanır: F = MST MSE F dağılım tablosundan serbestlik derecesi değerlerine göre CVF değeri bulunur. Eğer F > CVF ise Ho red edilir. Yani ortalamalar arasında farklılık yoktur.
SORU: 9 THY yolcularının yaş gruplarını (v9) dikkate alarak beklentilere yönelik hizmet kalitesine ait (v601) ve (v602) değişkenlerini ANOVA analizi ile test ediniz. İkili karşılaştırmaları Scheffe ile yaparak sonuçlarını yorumlayınız. (v601): Modern ekipmana sahip olmalıdır. (v602): Uçakların iç ve dış görünümü çekici olmalıdır.
ARAŞTIRMA MODELİ Sosyo- demografik Beklenen özellikler hizmet Yaş grubu ile Uçakların iç-dış görünümünün çekici olmasına yönelik beklenti. Sosyo- demografik özellikler Tüketim Alışkanlıkları Beklenen hizmet Algılanan hizmet kalitesi Tatmin Tüketicilerin sosyo-demografik özellikleri ve tüketim alışkanlıkları
AMAÇ: Yaş grupları arasında (demografik özellik) beklenen hizmet kalitesinde fark olup olmadığını inceleyeceğiz. 6 tane yaş grubunun (v601) ve (v602) değişkenlerindeki ortalamaları karşılaştırılacağı için tek yönlü varyans analizini kullanacağız.
HİPOTEZ: Ho: “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 H1 : “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır. Ho: “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 H1 : “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır.
df = grup sayısı -1 = 6-1 = 5 MST= SST / df =2,450 / 5 = 0,490
df = N –grup sayısı = 511-6 = 505 MSE = SSE / df =137,981 / 505 =0,273
F = MST / MSE = 0,490 / 0,273 = 1,793 F dağılımı (5, 505)
% 95 güven aralığı; F (5, 505) için F dağılımı tablosuna bakarsak; 2,21
Ho: “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 Ho red alanı Ho kabul alanı 2,21 1,793 F dağılımı (5, 505) = 2,21 Ho kabul edilir
F = MST / MSE = 1,613 / 0,538 = 2,995 F dağılımı (5, 505)
H1 : “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır. Ho red alanı Ho kabul alanı 2,21 2,995 Ho red, H1 kabul edilir. F dağılımı (5, 505) = 2,21
Sonuçlar: Bu örnekte; tek yönlü ANOVA (Varyans Analizi) yapılmıştır. İki bağımlı değişkenlerin her biri ayrı ayrı bağımsız değişken ile analize girmiştir bundan dolayı sonuçlar da ayrı ayrı değerlendirilmelidir. Burada tek yönlü MANOVA’ da yapılabilirde ama o zaman bağımlı değişkenler birlikte gözetilerek, bağımsız değişken ile analize tabi tutulmuş olurdu. Descriptes tablosuna baktığımızda 0.05 güven aralığı ile çalışıldığı görülmektedir. Bunun için ANOVA tablosundaki “significant değeri” 0.05 ile karşılaştırılır yada “Ft” değerleri bulunarak ANOVA tablosundaki “F” değerleri ile karşılaştırılır.
Sig= 0.113 > 0.05 Ho kabul FT 5, 505;0.05=2.21>1.79= FH Ho Kabul Grup ortalamaları arasında fark yok. Yaş gruplarına göre bir uçağı modern ekipmana sahip olması değişmemektedir. Sig= 0.011< 0.05 Ho red FT 5,505;0.05 =2.21<2.995=FH Ho red Grup ortalamaları arasında fark var. Uçakların iç ve dış görünümünün çekici olması yaş gruplarına göre farklılık göstermektedir. Peki farklılık hangi grup ya da gruplardan kaynaklanıyor? Scheffe yöntemi ile tek tek eşleştirmeleri inceleyerek bu farklılığın anlamlı bir farklılık olup olmadığına bakacağız. Ortalamalar arasındaki farkı F tablosunu da kullanarak kıyaslayacağız.
Bu ortalamanın diğer ortalamalardan farkı hesaplanır Multiple Comparisons:Scheffe Dependent Variable (I) Yaş (J) Yaş Mean Difference(I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound Uçakların iç ve dış görünümü çekici olmalıdır 18-24 25-34 -0,269 0,160 0,724 -0,802 0,264 35-44 -0,377 0,157 0,330 -0,901 0,147 45-54 -0,444 0,163 0,193 -0,988 0,100 55-64 -0,490 0,179 0,186 -1,087 0,107 65 ve üstü -0,740 0,245 0,106 -1,558 0,078 0,269 -0,264 0,802 -0,108 0,084 0,893 -0,388 0,172 -0,175 0,094 0,636 0,141 -0,221 0,120 0,637 -0,620 0,178 -0,471 0,206 0,390 -1,159 0,217 0,377 -0,147 0,901 0,108 -0,172 0,388 -0,067 0,090 0,990 -0,367 0,233 -0,113 0,116 0,966 -0,500 0,274 -0,363 0,204 0,674 -1,044 0,318 0,444 -0,100 0,988 0,175 -0,141 0,490 0,067 -0,233 0,367 -0,046 0,124 1,000 -0,460 -0,296 0,208 0,846 -0,993 0,400 -0,107 1,087 0,221 -0,178 0,620 0,113 -0,274 0,500 0,046 0,460 -0,250 0,937 0,488 0,740 -0,078 1,558 0,471 -0,217 1,159 0,363 -0,318 1,044 0,296 -0,400 0,993 0,250 -0,488 Örn; 18-24 yaş için ort 3,76 iken Bu ortalamanın diğer ortalamalardan farkı hesaplanır
Anlamlılık düzeyine baktığımızda; Multiple Comparisons:Scheffe Dependent Variable (I) Yaş (J) Yaş Mean Difference(I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound Uçakların iç ve dış görünümü çekici olmalıdır 18-24 25-34 -0,269 0,160 0,724 -0,802 0,264 35-44 -0,377 0,157 0,330 -0,901 0,147 45-54 -0,444 0,163 0,193 -0,988 0,100 55-64 -0,490 0,179 0,186 -1,087 0,107 65 ve üstü -0,740 0,245 0,106 -1,558 0,078 0,269 -0,264 0,802 -0,108 0,084 0,893 -0,388 0,172 -0,175 0,094 0,636 0,141 -0,221 0,120 0,637 -0,620 0,178 -0,471 0,206 0,390 -1,159 0,217 0,377 -0,147 0,901 0,108 -0,172 0,388 -0,067 0,090 0,990 -0,367 0,233 -0,113 0,116 0,966 -0,500 0,274 -0,363 0,204 0,674 -1,044 0,318 0,444 -0,100 0,988 0,175 -0,141 0,490 0,067 -0,233 0,367 -0,046 0,124 1,000 -0,460 -0,296 0,208 0,846 -0,993 0,400 -0,107 1,087 0,221 -0,178 0,620 0,113 -0,274 0,500 0,046 0,460 -0,250 0,937 0,488 0,740 -0,078 1,558 0,471 -0,217 1,159 0,363 -0,318 1,044 0,296 -0,400 0,993 0,250 -0,488 Anlamlılık düzeyine baktığımızda; tüm değerler 0,05’ten büyük olduğu için gruplar arasında anlamlı bir farkın olmadığı görülür.
Sonuçlar: Sig= 0.725 > 0.05 bu iki yaş grubu arasında önemli bir farklılık gözlenmediği söylenir. Tablo incelendiğinde yaş bağımsız değişkenlerinde, her iki bağımlı değişken için ortalamalar arası farklar anlamlı çıkmamıştır. Uçakların iç ve dış görünümünün çekiciliği gruplara göre ANOVA’da farklılık gösterse de hangi gruptan kaynaklandığı görülmemiştir çünkü Scheffe’ye göre gruplar arasındaki fark %95 anlamlılık düzeyinde anlamlı değildir.
Homogeneous Subsets Alt Grup Tablosuna da baktığımızda alt gruplara ayrılma yapılmadığını yani grupların modern ekipmana sahip olma ve uçakların iç ve dış görünümünün çekici olması konusunda benzer özellik gösterdiğini tekrardan görmekteyiz. Scheffe ile tek tek eşleştirmeler incelendiğinde, “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesi için gruplar arası anlamlı bir farklılık %95 güven aralığında gözlenmemektedir.
KÜMELEME ANALİZİ - Cluster Analysis Gruplanmış verileri birey ya da nesnelere temel özelliklerine dikkate alarak sınıflandırmada sıklıkla kullanılan çok değişkenli istatistiksel bir yöntemdir. Kümeleme analizi bize özetleyici bilgileri sunmaktadır. Analiz sonucunda oluşan kümeler arasında heterojenlik, kümelerin kendi içlerinde homojenliği yüksektir.
KÜMELEME ANALİZİ - Cluster Analysis Kümeleme analizinde değişkenler bağımlı ve bağımsız olarak ikiye ayrılmamaktadır. Kümeleme analizi şunlar için kullanılabilir; Bir araştırmada gözlem sayımız çok fazla olduğu zaman kümeleme sayesinde analizin yapılmasını ve verilerin yorumlanmasını kolaylaştırır. Bazen araştırmacılar varsayım geliştirmek ya da varsayımlarını önceden test etmek istediklerinde kullanırlar.
SORU: 10 THY verilerini dikkate alarak faktör analizi sonucu elde edilen boyutlara göre ((Güvenilir1), (Müsteri1), (Anindahizmet1), (Güventelkinetme1), (Fizikiunsurlar1)) kümeleme analizini yapınız. Kümeleme analizinde k-ortalamalar yöntemini (k=3) kullanınız. Elde edilen kümelerin faktörler itibariyle farklılıklarının anlamlı olup olmadığını LSD (Least Significance Difference) testi ile inceleyerek yorumlayınız.
ARAŞTIRMA MODELİ Sosyo- demografik Beklenen özellikler hizmet Tüketim Alışkanlıkları Beklenen hizmet Algılanan hizmet kalitesi Tatmin Tüketicilerin sosyo-demografik özellikleri ve tüketim alışkanlıkları
AMAÇ: Hizmet algısını ölçmek için hazırlanan değişkenleri Faktör analizi ile 5 faktörde toplamıştık. Bu faktörlere kümeleme analizi uygulayıp benzer özellik gösterenleri belirleyeceğiz ve küme farklılıklarının anlamlı olup olmadığına bakacağız. Faktörler: 1-Güvenilir ve doğru hizmet, 2-müşteriyi tanıma ve anlama, 3-anında hizmet, 4-güven telkin etme, 5-fiziki unsurlar. 29 29
İlk kümeleme merkezi; Üç kümeleme olduğu belirtildiği üzere Tekrarlamayı Running Means seçsek de 5 tekrarlamada 3 kümelenin oluştuğunu görülmekte. Değerler neredeyse sıfır artık bu değişim bitti demektir.
Final Cluster Centers tablosuna baktığımızda, 5 değişkenin 3 kümedeki ortalamalarını verdiğini görüyoruz. Bütün bu değişkenlerden en çok zevk alan 1. kümedir Her kümeye isabet eden gözlem sayısını vermektedir. Kümeye 161 gözlem Kümeye 213 gözlem Kümeye 137 gözlem
ANOVA’da bütün değişkenlerin sig değerleri 0 ANOVA’da bütün değişkenlerin sig değerleri 0.05’ten küçük olduğu için Ho red yani kümelerin ortalamalar arası farkı anlamlıdır diyoruz. Zaten kümeleme ile bu fark kendiliğinden gelir, kümeler arası fark max yapılarak 3 kümeye indirgenmiştir. FT 2.508;0.05= 3 bu değer bütün FH’lardan küçük olduğu için Ho red edildiği buradan da söylenir.
Grupların tanımlayıcı istatistikleri:
1. Sig =0.000> 0.05 Ho red FT 2.508;0.05=3 < FH=186.665 Ho red 2,3,4,5 içinde aynı şeyler yapılır Ho red sonucu çıkar.
Sonuçlar: Güvenilir ve doğru hizmette sınıflar arası fark anlamlıdır. Müşteriyi tanıma anlama için sınıflar arası fark anlamlıdır. Anında hizmet için sınıflar arası fark anlamlıdır. Güven Telkin Etme için sınıflar arasındaki fark anlamlıdır. Fiziki unsurlar için sınıflar arası fark anlamlıdır.
Çoklu karşılaştırma tablosu
SONUÇLAR: Güvenilirlik ve Doğru Hizmet için 1. ve 2. grup arasında fark 1-2= I-J= 0.36724’tür. Sig= 0.049 <0.05 Bu iki grup arasında farklılık olduğu söylenir. Zaten SPSS programı aralarında farklılığın olduğu gruplara “*” işareti koymuştur. Güvenilirlik ve Doğru Hizmet için bütün gruplar birbirinden farklıdır. Müşteriyi Tanıma ve Anlama değişkeni için 1. grup 2.ve 3. gruptan farklılık göstermektedir. Anında Hizmet değişkeni için farklılığı gösteren 3. gruptur. Güven Telkin Etme değişkeni için farklılığı gösteren 3. gruptur. Fiziki unsurlar değişkeni için bütün gruplar birbirinden farklılık göstermektedir.
Nihai Küme Merkezleri sonucu, genel olarak, değişkenlere sırasıyla 1, 2, 3 daha fazla önem vermektedir. (1>2>3) ANOVA’da en yüksek değeri “Müşteriye Yakınlık” değişkeni aldığı için, bu özellik bakımından kümelemedeki ayrışmanın (birbirinden uzaklığın) diğerlerine kıyasla daha fazla olduğu görülmektedir. ANOVA sonucu tüm kümelerin birbirinden p=0.05 düzeyinde ortalamalar bakımından farklı oldukları görülmektedir. (H0 red: En az bir değişken diğerlerinden farklıdır) Daha detaylı bilgi için LSD yapılarak, hangi kümelerin değişkenler bazında birbirinden farklı olduğuna bakılır. Sonuç olarak “Hizmet ve Uçak Kalitesi” bakımından 1. ve 2. kümeler hariç diğer tüm kümelerin ortalamalarının farklı olduğu sonucuna varılır.
Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın Teşekkürler… Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın