THY SPSS UYGULAMASI 1.SORU:Kİ-KARE ANALİZİ Feyza TAŞKIN Aygül DÖNMEZ Aralık, 2009
Ki-Kare Analizi Yaygın kullanımın en önemli nedenleri, çok basit bir analiz türü olması, kullanım alanının çok geniş olması, esnekliğinin fazla olması, varsayımlarının azlığı ve çok güçsüz ölçeklerde (örneğin nominal ölçekte) ölçülmüş verilere uygulanabilmesidir.
Amaçları Örnek değerlerinin dağılımının belirli bir teorik dağılıma uyma derecesinin saptanması (uygunluk testi). İki veya daha fazla nitelik esas alınarak sınıflandırılan veriler değerlenerek bu nitelikler arasındaki ilginin derecesinin belirlenmesi (bağımsızlık testi veya kontenjans tablosu analizi).
Ki- kare analizi iki veya daha fazla veri seti arasında önemli bir farkın olup olmadığını belirlemede araştırmacının kullanabileceği bir istatistiksel analiz yöntemidir. Bu yöntemde gözlem verileri ile beklenen veriler kıyaslanır.
Ki-Kare Uygulanmasının Şartları Analiz oranlara uygulanamaz. Gerçek değerlerin esas alınması gerekir. Gözlenen değerler sıfır olamaz. Beklenen değerlerin %20’sinden fazlası 5’ten küçük olamaz. Beşten az gözlemin yer aldığı tablolar olursa, en az beş gözlemi tamamlayacak şekilde satırlar veya sütunlar arası birleşmelere gidilir. Ki-Kare analizi frekans dağılımları üzerinden hesaplanır.
Ki-Kare Hesaplanması oij: i. satır ve j. sütundaki şıkka ait gözlem değeri (gözlenen frekans) eij: i. satır ve j. sütundaki şıkka ait beklenen değer (teorik frekans- beklenen frekans)
Ki-Kare Homojenlik Testi İki ya da daha fazla bağımsız örneklemin, aynı ana kütleden seçilip seçilmediğinin araştırılmasında kullanılır. Hipotezler: H0: İki örneklem de aynı ana kütleden seçilmiştir. H1: Örneklemler farklı ana kütlelerden seçilmiştir.
Ki-Kare Uygunluk Testi Gözlenen değerlerin belirli bir dağılıma uygun olup olmadığının sınanmasına Ki-Kare Uygunluk testi denir. Hipotezleri: H0: Örnek değerlerinin dağılımı belirli bir teorik dağılıma uymaktadır. H1:Örnek değerlerinin dağılımı belirli bir teorik dağılıma uymamaktadır. Örnek: bir cevaplayıcı grubunun kullandıkları şampuan markaları arasında dağılımın seyri örnek olarak gösterilebilir. Tercihler belirli markalarda mı yoğunlaşmaktadır; yoksa markalar arasında eşit bir dağılım mı göstermektedir? (Gözlem değerlerinin oran şeklinde olması halinde Kolmogorov- Simirnov test istatistiğinden yararlanılır)
Ki-Kare Bağımsızlık Testi (ilgi testi-Pearson ki-kare testi) İki değişken arasında bir ilgi olup olmadığını, yani iki değişkenin birbirinden bağımsız olup olmadığını belirlemek amacıyla kullanılır. Ki-kare bağımsızlık testi, uygunluk testindeki hesaplamalardan farksızdır. Ancak bu testte teorik (beklenen) frekansların hesaplanması farklıdır. Bağımsızlık için ki-kare testi, ikisi de sınıflama veya biri sınıflama diğeri sıralama (ordinal) düzeyinde ölçülen iki değişkenin ilişkili olup olmadığını belirlemeye yönelik parametrik olmayan bir testtir. Örneğin: “gelir düzeyi ile siyasi parti seçimi”, “eğitim düzeyi ile okunan gazete”, “iş tatmini düzeyi (evet, kısmen, hayır) ile ücret” değişkenleri arasındaki ilişkiler Ki – Kare Bağımsızlık Testi ile incelenebilir.
Hipotezler: H0:İki nitelik birbirinden bağımsızdır. H1:İki nitelik birbirinden bağımsız değildir. serbestlik Dercesi (δ)=(c-1)(r-1) dir. Serbestlik derecesi arttıkça "Ki-kare" testi normal dağılıma benzemeye başlar. Ayrıca "Ki-kare" değeri serbestlik derecesine bağlı olduğundan, analizde yer alan gözlem sayısı arttıkça "Ki-kare" değeri de artar. Sonuçta anlamlı farklılıkların varlığına ilişkin işaretler elde etme olasılığı da artar.
THY VAKASI 1. SORU THY verilerinde yer alan genellikle tercih edilen bilet sınıfı (v4) ile yolcuların geliri (v12) arasında anlamlı bir ilginin olup olmadığını ki-kare analizi ile inceleyip yorumlayınız. Genellikle tercih edilen bilet sınıfı (v4) Ekonomi Business
Aylık gelir (v12) 1.000.000.000 ve altı 1.000.000.001-2.000.000.000 2.000.000.001-3.000.000.000 3.000.000.001-4.000.000.000 4.000.000.001-5.000.000.000 5.000.000.001 ve üstü
Beklenen Değerin Hesaplanması Sütun veya satırların birbirinden bağımsız olduğunu varsaydığımızda örnekteki herhangi bir yolcunun ekonomi sınıfını tercih etmesi ve 1.000.000.000 ve altı gelire sahip bir yolcu olması olasılığı herhangi bir yolcunun 1. satır ve 1. sütunda olması olasılıklarının çarpımına eşittir. Bu da:
Bilet sınıfı ekonomi olan ve 1. 000. 000 Bilet sınıfı ekonomi olan ve 1.000.000.000 ve altı gelire sahip olan yolcuların teorik veya beklenen sayısı ise olasılıkla örnek sayısının çarpımına eşittir. Yani:
Karar Hesaplanan X2 değeri (45,02), teorik X2 değerinden (11,07) büyük olduğundan %5 önem derecesinde H0 hipotezi red edilecek, H1 hipotezi kabul edilecektir. Yolcuların sahip oldukları gelir ile tercih etmiş oldukları bilet sınıfı arasında %5 önem derecesinde bir ilişki vardır, yani bu iki nitelik birbirinden bağımsız değildir.
Bu sonuçlar, şu sorumuza da cevap bulabilir: Bu farklılığa en çok ve en az sebep olan kesim kimlerdir? Farklılığa en çok sebep olan kesim X2' si en yüksek çıkan e26 ve e22 hücresi, yani 5.000.001 ve üstü gelire sahip olup Business bilet sınıfını seçenler ile 1.000.000.001-2.000.000.000 gelire sahip olup Business bilet sınıfını seçen yolcular olmuştur(Çünkü beklenen değer, gözlenen değerden en uzak noktadadır).
THY ÖRNEĞİ SPSS UYGULAMASI SORU 1: THY verilerinde yer alan genellikle tercih edilen bilet sınıfı (v4) ile yolcuların geliri (v12) arasında anlamlı bir ilginin olup olmadığını ki-kare analizi ile inceleyip yorumlayınız.
Genellikle tercih edilen bilet sınıfı THY ÖRNEK UYGULAMASI DEĞİŞKENLER: Genellikle tercih edilen bilet sınıfı (v4) Ekonomi Business Aylık gelir (v12) 1.000.000.000 ve altı 1.000.000.001-2.000.000.000 2.000.000.001-3.000.000.000 3.000.000.001-4.000.000.000 4.000.000.001-5.000.000.000 5.000.000.001 ve üstü İlgili Değişkenler Değişkenin Tanımı Ölçek Türü v4 Değişkeni Genellikle tercih edilen bilet sınıfı Nominal(Sınıflama) v12 Değişkeni Gelir Ordinal(Sıralama)
THY ÖRNEK UYGULAMASI Hipotezler H0:Genellikle tercih edilen bilet sınıfı (v4) ile gelir (v12) arasında anlamlı bir ilişki yoktur. H1:Genellikle tercih edilen bilet sınıfı (v4) ile gelir (v12) arasında anlamlı bir ilişki vardır. Anlamlılık Derecesi α=0.05 olarak belirlenmiştir. Karar Kriteri %5 önem derecesinde ve 5 serbestlik derecesinde teorik χ2 değeri, χ2 tablosundan χ2 (0,05;5) =11,07 olarak bulunur.
THY Kİ-KARE SPSS UYGULAMASI SPSS 16.0 programı kullanılarak THY verilerinden “Genellikle Tercih Edilen Bilet Sınıfı(v4)” “Gelir(v12)” verileri arasında anlamlı bir ilişki olup olmadığı Ki-Kare analizi ile test edilmiştir. SPSS programında bu analizin nasıl yapılacağı aşağıda 4 adımda gösterilmektedir:
1. ADIM: SPSS Genel Penceresi
2. ADIM: Beklenen Değer Tablosu İçin Satır ve Sütun Seçimi: (CrossTabs Ayarları)
3. ADIM: Uygulanan İstatistiksel Analizin Seçimi (Crostabs: Statistics Ayarları)
4. ADIM: Beklenen Değer Tablosu için Gerekli Ayarların Yapılması(Cell Display Ayarları)
THY Kİ-KARE SPSS UYGULAMASI THY verilerinden; Hangi verilerin hangi analize tabi tutularak bu çıktının alındığını gösteren özet tablodur. Genellikle tercih edilen bilet sınıfı (v4) ile Gelir(v12) ilişkilendirilmesinin yapılarak Ki-Kare Analizine tabi tutulan SPSS özet çıktı penceresi yanda görülmektedir.
THY Kİ-KARE SPSS SONUÇLARI SPSS Ki-Kare analizi sonucu çıkan bu tabloda; - 511 tane örnekten alınan verilerin tamamının uygun veriler olduğu, - Yani ankette “Genellikle tercih edilen bilet sınıfı ve Gelir” sorularının tümüne cevap verildiği hiç boş veya yanlış işaretlenen soru bulunmadığı anlamına gelmektedir.
Kontenjans Tablosu
THY Kİ-KARE SPSS SONUÇLARI Kontenjans Tablosunun Sonuçları Bu tabloda hangi gelir düzeyine sahip kişilerin hangi bilet türünü seçtiği gözlenen değerler ve beklenen değerler şeklinde gösterilmiştir. Ayrıca bu değerlerin toplam satır(genellikle tercih edilen bilet sınıfı) ve toplam sütun(gelir) değerlerine göre yüzdeleri de tabloda açıklanmaktadır.
THY Kİ-KARE SPSS SONUÇLARI χ2 (0,05;5) =11,07 < χ2 = 45.025 Hesaplanan Ki-Kare değeri tablo değerinden büyük olduğu için H0 hipotezi reddedilecektir. Bunun Anlamı; - Yolcuların sahip olduğu gelir ile tercih edilen bilet sınıfı birbirinden bağımsız değildir. - THY ile ilgili Ki-kare araştırma sonuçlarına göre v4 (Genellikle tercih edilen bilet sınıfı)ve v12 (Gelir) değişkenleri arasında anlamlı bir ilişki bulunduğu görülmektedir.
THY Kİ-KARE SPSS SONUÇLARI SPPS Chi-Square Test Tablosunun; - Assymp.Sig. sütunun en üstündeki anlamlılık değerinin p = 0,00 olduğu görülmektedir. Bu değer p < 0,05 şartını karşıladığından bilet sınıfı ile gelir arasındaki ilişkinin anlamlı olduğu söylenebilir. - %5 önem derecesinde H0 hipotezi red edilecek, H1 hipotezi kabul edilecektir. Bu ilginin kaynağını belirlemek için ise farklılığa en çok sebep olan kesimi bulmak gerekmektedir.
THY Kİ-KARE SPSS SONUÇLARI Farklılığa en çok sebep olan beklenen değeri, gözlenen değerden en uzak olan kesimdir. Farklılığa sebep olan değerler Kontenjas Tablosunda görüldüğü gibi; e26= 5.000.001 ve üstü gelire sahip olup Business bilet sınıfını seçen yolcular (bu grubun beklenenden daha fazla business bilet sınıfı tercih ettikleri söylenebilir) e22=1.000.000.001-2.000.000.000 gelire sahip olup Business bilet sınıfını seçen yolculardır (bu grubun beklenenden daha az business bilet sınıfı tercih ettikleri söylenebilir)
TEŞEKKÜRLER