THY ANALİZLERİ Ki – Kare Testi
KARL PEARSON (1857 - 1936) Temel ilgi alanı genetiktir. 1892’de “The Grammar of Science” adlı kitabı yayınlandı.İzleyen yıllarda kalıtım ve evrim süreçlerine ilişkin çalışmalar sırasında istatistikle ilgilendi. Regresyon ve korelasyon konularındaki önemli katkılarının yanı sıra, kuramda kendi adıyla anılan ve gözlem değerlerinin olasılık dağılımlarına ilişkin Pearson eğri sistemini ve 1912 yılında da Ki-kare testini geliştirdi.
GİRİŞ İstatistikte değişkenler, sayısal (nicel) değişkenler ve sayısal olmayan (nitel) değişkenler olmak üzere iki grupta sınıflandırılmaktadır. Günümüzde yapılan bir çok araştırmada sayısal olmayan değişkenlerin dikkate alındığı gözlemlenmektedir. Örneğin, insanların medeni durumlarıyla seçtikleri meslek grupları arasındaki bir ilişki incelenmek istendiğinde, medeni durumun ve meslek grubunun rakamlarla ifade edilmesi olası değildir. Medeni durum “evli”,“bekar”, “boşanmış” ve “dul” şeklinde gösterilirken meslek grupları da “serbest meslek”, “devlet memurluğu”, “işçi”, vb. şeklinde gruplandırılabilir. İşte sayısal olmayan değişkenler arasında herhangi bir ilişkinin var olmadığını ileri sürerek (Ho hipotezi), bu hipotezin red edilip edilemeyeceğinin incelenme- sinde uygulanan test Ki-Kare testi’dir.
Kİ – KARE İLGİ ANALİZİ Bir faktörün diğer bir faktöre etkisinin olup olmadığını ya da bir dağılımın homojen olup olmadığını test eder. Beklenen değerlerle gözlenen değerler arasındaki farkın anlamlı olup olmadığının testidir. Genellikle bir faktörün diğer bir faktöre bağlı olarak değişip değişmediğini veya etkisi olup olmadığının belirlenmesi amacıyla kullanılır.
Kİ-KARE ANALİZİNİN BAŞLICA NİTELİKLERİ Araştırmanın amacı, örnek değerinde gözlenen ilgi hakkında bir yargıya varmaktır. Odak noktası bireylerin seçilen bazı nitelikleridir. Veri matrisini iki veya daha fazla sayıdaki alt setlere ayırmada analiz öncesi yargılar kullanılır. Kriter ve tahmin değişkenleri sayısı şart olmamakla birlikte genelde ikidir. İlginin fonksiyonel formunun doğrusal olması gerekmez. Analiz doğrusal olmayan ilişkilere de uygulanabilir. Veriler nominal ölçekte ölçülmüş olabilir.
Kİ-KARE KULLANIM NEDENLERİ? Bu analizin yaygın kullanımının en önemli nedenleri şöyle sıralanabilir; Çok basit bir analiz türü olması, Kullanım alanının çok geniş olması, Varsayımlarının azlığı, Çok güçsüz ölçeklerde ölçülmüş verilere uygulanabilmesi
Hipotezlerin Test Edilmesindeki Adımlar Hipotezler kurulur Ho: “Gözlenen değer ile beklenen değer arasında Fark yoktur” H1 : “Fark vardır” Anlamlılık Düzeyi (Güven Düzeyi) belirtilir. [%95 veya %99] Serbestlik Derecesi hesaplanır [sd=df] Bağımsızlık testinde ; (satır sayısı-1).(sütun sayısı-1) Uygunluk testinde ; (satır sayısı Ti lerin hesabı için hesaplanması gereken parametre sayısı-1) Test değeri hesaplanır. (Kikare Test Değeri) Anlamlılık Değeri [Sign (p)] [0-1 arasında olacaktır] Sonuç : [p>0,05 Ho kabul – p<0,05 Ho rededilir] Yorum:
Kİ- KARE ANALİZ YÖNTEMİ Ki-kare analiz yöntemi gözlenen frekans değerleri (Gi) ile teorik olarak beklenen frekans değerlerinin (Ti) karşılaştırmasını yapar. Bir çapraz tabloda yer alan her bir hücre için bu iki değer arasındaki farkın kareleri alınır. Beklenen değere olan oranı bulunur. Bu oranların toplamı ise "Ki-kare" değerini verir. Bulunan bu değer kritik tablo değerinden büyük ise anlamlı bir ilişkinin varlığından sözedilebilir.
Kİ-KARE UYGUNLUK TESTİ Ki-kare testi, Parametrik olmayan testler içerisinde en yaygın kullanımı olan testlerdendir. Frekans tablolarında Uygunluk testi, çapraz tablolarda ise Bağımsızlık testi biçiminde uygulanır. Ki-kare uygunluk testi, verilerin herhangi bir dağılımının uygunluğunu test etmek için kullanılır. Ki-kare bağımsızlık testi ise ilişki ölçer. İki bağımsız değişken arasındaki ilişkiyi ölçer.
Kİ-KARE UYGUNLUK TESTİ Frekans tablosundaki verilerin her hangi bir teorik dağılıma uygunluğunu test eder. Uygunluk testinde hipotezler : H0: “İlişki yoktur” H1: “ilişki vardır” Bu teste frekans tablosunun teorik değerleri, gözlemsel frekans dağılımının uyduğu bilinen belirli yada herhangi bir dağılıma göre hesaplanabilir. Örneğin, gözlemsel frekans dağılımının Normal, Tekdüze, Üstel, Binom, Poisson, vb. Dağılımlara uyduğu düşünülüyorsa bu dağılımların olasılık yoğunluk fonksiyonlarına göre teorik değerler hesaplanır.
Kİ-KARE UYGUNLUK TESTİ n hacimli bir örneklemin, ilgili ana kütleyi, iyi temsil edip edemediğini belirleyebileceksiniz. Ki-kare uygunluk testinin esasını, n hacimli (birimlik) bir örneklemin anakütleyi iyi temsil edip edemeyeceğini araştırmak oluşturur. Bu testte, gözlenen ve beklenen frekanslardan yararlanılır. Örnek hipotez; Üniversite öğrencilerinin barınma yeri konusundaki tercihleri arasında anlamlı bir farklılık var mıdır?
Kİ-KARE BAĞIMSIZLIK TESTİ Ki – Kare Bağımsızlık Testi iki değişken arasındaki ilginin derecesinin belirlenmesi amacıyla kullanılır. Bu testte diğer ilişkisel analizlerden farklı olarak ilişki kurulan değişkenlerin her ikisi de Nominal (Sınıflama) ya da Ordinal (Sıralama) ölçeklidir. Daha açık bir ifade “gelir düzeyi ile siyasi parti seçimi”, “eğitim düzeyi ile okunan gazete”, “iş tatmini düzeyi (evet, kısmen, hayır) ile ücret” değişkenleri arasındaki ilişkiler Ki – Kare Bağımsızlık Testi ile incelenebilir.
Kİ-KARE BAĞIMSIZLIK TESTİ İki ya da daha fazla sınıfı iki nitel değişken arasında bağımsızlık olup olmadığını incelemek için, Ki-Kare bağımsızlık testine başvurmak gerekir. Bu test yapılırken, Kontenjans tablosundan yararlanılmaktadır. Bu tablo, incelenen iki değişkenin şıklarına düşen gözlenen frekansların yazıldığı, yatay (satırlar) ve düşey (sütunlar) bantlardan oluşan, çift yönlü tablodur.
Kİ-KARE BAĞIMSIZLIK TESTİ İki ve daha fazla kategoriye sahip X ve Y değişkenlerinin kategorilerinin birbirleri ile bağımlı/ bağımsız olup olmadıklarını test eder. H0: “ilişki yoktur” H1: “ilişki vardır” şeklinde hipotez kurulur. Örnek hipotez; Bir yörede yaşayan halkın siyasi parti tercihi meslek dallarına göre anlamlı bir farklılık gösterir mi?
KONTENJAN KATSAYISI Sayısal olmayan iki değişken arasındaki ilişkinin derecesini belirleyebileceksiniz. Ki-kare bağımsızlık testiyle, iki değişken arasındaki ilişkinin varlığıyla ilgili karar verebiliyordu. Oysa ki bazı hallerde, iki değişken arasındaki ilişkinin kuvveti hakkında da bilgi sahibi olmak istenebilir. İşte kontenjans katsayısı ilişki düzeyini saptamak amacıyla kullanılan bir katsayıdır. İki değişken arasında bir ilişki bulunmuyorsa 0 değeri verir. Buna karşılık iki değişken arasında en üst düzeydeki ilişki katsayısı her zaman 1 çıkmaz, 1’e çok yakın bir değer olur. c ile gösterilen kontenjans katsayısının formülü şeklindedir.
Kİ- KARE HOMOJENLİK TESTİ Farklı örneklemlerin aynı ana kütleden seçilip seçilmediğini test edebileceksiniz. Ki-kare homojenlik testi ana çizgileriyle, iki ya da daha fazla bağımsız örneklemin,aynı ana kütleden seçilip seçilmediğinin araştırılmasında kullanılır. Testin uygulaması,ki-kare bağımsızlık testinde olduğu gibidir. Yine nitel değişkenlerle ve aynı örneklem istatistiğiyle çalışılır. Ancak, dikkat edilmelidir ki, bağımsızlık testinde ele alınan değişkenler arasında bir ilişkinin varlığı araştırılırken, homojenlik testinde bağımsız örneklemlerin aynı ana kütleden seçilip seçilmediği araştırılmaktadır.
SPSS Kullanımı Analyze→Descripti Statistics →Crostabs
Statistics: Chi- square
Cell:counts: Observed + Expected Percentages: Row, Column, Total seçilir.
YORUMLAR Ki-kare analizinin uygulanabilmesi için, gözlenen değerlerin hiçbirinin 0 değerini almaması ve teorik (beklenen) değerlerin %20 sinden fazlasının 5 den küçük olmaması gerekir. Örnekteki tabloları incelediğimizde bu kurala uygun olduğunu görüyoruz. (Şayet şarta uygunluk olmasaydı, araştırmacı bu değerlerin ortaya çıktığı sütun veya satırları diğer sütun ve satırlarla birleştirerek analizi yeniden uygulamadır.)
YORUMLAR Ekonomi sınıfı tercih edenlerin %84,2 si 1.000.- TL ve altı gelire sahiptir. Ekonomi sınıfı tercih edenlerin %90,6 si 1.000.- TL ve 2.000.- TL arası gelire sahiptir. Business sınıfı tercih edenlerin % 47,4 ü 5.000.- TL ve üzeri gelire sahiptir. Business sınıfı tercih edenlerin % 39,3 ü 4.000.- TL ve 5.000.- TL arası gelire sahiptir.
GENEL YORUM Ekonomik bilet sınıfının genelde daha düşük gelir seviyesine sahip kişiler tarafından tercih edildiği, Business bilet sınıfının ise genelde daha yüksek gelir seviyesine sahip kişiler tarafından tercih edildiği görülmektedir.