SPSS’TE ÇAPRAZ TABLO Çapraz tablo temel olarak, iki kategorik değişken arasındaki ilişkiyi analiz etmek için kullanılır. Örneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi. Çapraz tablolar izlenen amaca göre üç türlü yapılmaktadır. (Darcy ve Rohrs, 1995) Bir değişkenin bir başka değişken üzerindeki etkisini göstermek (yüzdelemenin yönü eğer satır -yatay yönündeki- değişkeni bağımsız değişken ise bu yönde, yok eğer bağımsız değişken sütün – dikey yönündeki- değişkeni ise bu yönde yapılır).
Analyze → Descriptive Statistics → Crosstabs… Bir grubun komposizyonunu (dağılımını) belirlemek için. Çaprazlanan değişkenler sonucu ortaya çıkan olası alt grupların bütün içindeki komposizyonunu belirlemek için. Örneğin cinsiyet ile gelir düzeyi arasındaki ilişkiyi gösteren çapraz tablonun oluşturulmasında SPSS’te aşağıdaki adımlar uygulanır. Analyze → Descriptive Statistics → Crosstabs…
Cells… menüsünde aşağıdaki kısımlar işaretlenir.
Gelir düzeyi ile Türkiye için gelecek beklentisi arasındaki çapraz tablo sonuçları ise şöyledir:
Kİ-KARE BAĞIMSIZLIK TESTİ Uygulamalı çalışmalarda değişkenlerin büyük bir bölümü sınıflama ya da sıralama ölçme düzeyinde nitel değişkenlerdir. Eğer iki değişken arasında ilişki yoksa bu iki değişkenin bağımsız olduğu söylenebilir. İki değişken bağımsız ise değişkenlerden birinin değerini bilmek, diğer değişkenin alacağı değeri tahmin etmemize yardımcı olmaz. Sınıflama ya da sıralama ölçme düzeyinde gözlemlenmiş iki değişken arasındaki ilişki Ki-kare ( 𝜒 2 )bağımsızlık testi ile araştırılabilir.
𝜒 2 bağımsızlık testinde çapraz tablonun oluşturulması önemli bir yer tutar. Bu tablonun oluşturulmasında öncelikle değişkenlerin kaç farklı değer alacağı saptanır. Birinci değişken (𝑋 1 ) düzeyleri 𝑐 ve ikinci değişken (𝑋 2 ) 𝑟 düzeyli olsun. Bu durumda 𝑛 𝑖𝑗 : 𝑋 1 değişkeninin 𝑖. ve 𝑋 2 değişkeninin 𝑗. düzeyindeki örnek birimlerinin sayısı (Gözlenen frekanslar) 𝑛 .𝑖 : 𝑋 1 değişkeninin 𝑖. düzeyindeki örnek birimlerinin sayısı 𝑛 𝑗. : 𝑋 2 değişkeninin 𝑗. düzeyindeki örnek birimlerinin sayısı Gözlenen frekanslar 𝐺 𝑖𝑗 = 𝑛 𝑖𝑗 ile gösterilirsin.
𝐻 0 :Değişkenler bağımsızdır. 𝐻 1 :Değişkenler bağımsız değildir 𝐻 0 :Değişkenler bağımsızdır. 𝐻 1 :Değişkenler bağımsız değildir. 𝜒 2 bağımsızlık testi gözlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir. İki değişken bağımsız ise 𝑖. satır ve 𝑗. sütunda yer alan hücre için beklenen frekans 𝐵 𝑖𝑗 𝐵 𝑖𝑗 = 𝑛 .𝑖 × 𝑛 𝑗. 𝑛 şeklinde hesaplanır. 𝐻 0 hipotezi doğru iken test istatistiği 𝜒 ℎ 2 = 𝑖=1 𝑐 𝑗=1 𝑟 𝐺 𝑖𝑗 − 𝐵 𝑖𝑗 2 𝐵 𝑖𝑗
Bu test istatistiği 𝑐−1 𝑟−1 serbestlik dereceli 𝜒 2 dağılımına sahiptir. Yukarıda tanımlanan 𝜒 ℎ 2 değeri, araştırmacı tarafından önceden belirlenen 1. tip hata düzeyine 𝛼 karşılık gelen 𝜒 2 tablo değeri ile karşılaştırılarak 𝐻 0 hipotezi test edilir. 𝜒 ℎ 2 > 𝜒 𝑇𝑎𝑏𝑙𝑜 2 ise 𝐻 0 hipotezi reddedilebilir. 𝜒 ℎ 2 ≤ 𝜒 𝑇𝑎𝑏𝑙𝑜 2 ise 𝐻 0 hipotezi reddedilemez.
𝜒 ℎ 2 = 𝑖=1 𝑐 𝑗=1 𝑟 𝐺 𝑖𝑗 − 𝐵 𝑖𝑗 −0.5 2 𝐵 𝑖𝑗 Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar Beklenen frekanslar 1’den küçük olmamalıdır. Beklenen frekansların en fazla %20’si 5’den daha küçük olabilir. Bu koşullar sağlanmadığında Örnek çapı arttırılabilir Satırlar veya sütunlar birleştirilebilir (iii) Her iki değişken için düzeylerin 2 olması durumunda (2×2) Yates düzeltmesi yapılmalıdır. 𝜒 ℎ 2 = 𝑖=1 𝑐 𝑗=1 𝑟 𝐺 𝑖𝑗 − 𝐵 𝑖𝑗 −0.5 2 𝐵 𝑖𝑗
Örnek 1. Eğitim düzeyi ile gelir düzeyi arasında %5 anlamlılık düzeyinde ilişki var mıdır?
𝐻 0 : Eğitim düzeyi ile gelir düzeyi arasında ilişki yoktur 𝐻 0 : Eğitim düzeyi ile gelir düzeyi arasında ilişki yoktur. 𝐻 1 : Eğitim düzeyi ile gelir düzeyi arasında ilişki vardır. Yukarıdaki tabloda 𝐻 0 hipotezinin testinde Pearson Chi-Square değerine bakılır. 𝜒 ℎ 2 =52.829 ve p-değeri=0.000<0.05 olduğundan ‘Eğitim düzeyi ile gelir düzeyi arasında ilişki yoktur’ sıfır hipotezi reddedilebilir.
Örnek 2. Cinsiyet ile yaşanılan yer arasında %5 anlamlılık düzeyinde ilişki var mıdır? 𝐻 0 : Cinsiyet ile yaşanılan yer arasında ilişki yoktur. 𝐻 1 : Cinsiyet ile yaşanılan yer arasında ilişki vardır.
Çapraz tablo 2×2 olduğundan Pearson Chi-Square değeri yerine Continuity Correction (Yates Düzeltmeli 𝜒 ℎ 2 ) katsayısına bakılır. 𝜒 ℎ 2 =0.629ve p-değeri=0.426>0.05 olduğundan ‘Cinsiyet ile yaşanılan yer arasında ilişki yoktur’ sıfır hipotezi reddedilememektedir. Çapraz tablo 2×2 olduğunda ve 5’den küçük beklenen frekansların sayısı %20’den büyük olduğunda birleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır.
İLİŞKİ KATSAYILARI Sınıflama-Sınıflama Ölçme Düzeyindeki Değişkenlerde Kullanılan İlişki Katsayıları 1. Olağanlık katsayısı (Contingency Katsayısı) C= 𝜒 2 𝑛+ 𝜒 2 Bu katsayı değişkenlerin her ikisi de 3 ve 3 den fazla kategorili karesel tablolarda kullanılır. 0 ile 1 arasında değer alır. İlişki katsayısı tablonun boyutundan etkilenir. Boyut arttığında katsayının düzeltilip yorumlanması gerekir. Değişkenler arasındaki ilişki tam olduğunda dahi olağanlık katsayısı 0.707 olarak elde edilir.
2. Phi (𝜙) ϕ= χ 2 n Çapraz tablo 2×2 olduğunda kullanılır 2. Phi (𝜙) ϕ= χ 2 n Çapraz tablo 2×2 olduğunda kullanılır. Alabileceği değerler 0.00 ile 1.00 arasında değişmektedir. 0.00 iki değişken arasında hiçbir ilişkinin olmadığını gösterirken, 1.00 iki değişken arasındaki ilişkinin doğrusallığın mükemmel olduğunu gösterir. Geleneksel olarak 0.33’ün altındaki ilişkiler zayıf, 0.34-0.60 civarındaki ilişkiler orta, 0.61 ve daha yüksek ilişkilerin ise güçlü olduğu varsayılır.
3. Cramer 𝜐 Katsayısı 𝜐= χ 2 n 𝑘−1 𝑘: Matristeki en küçük satır veya sutun sayısı İki değişkenin kategori sayıları birbirine denk değildir. Matris 2x3, 3x5 gibidir. Tablonun boyutundan etkilenmez. Alabileceği değerler 0.00 ile 1.00 arasında değişmektedir. 0.00 iki değişken arasında hiçbir ilişkinin olmadığını gösterirken, 1.00 iki değişken arasındaki ilişkinin doğrusallığının mükemmel olduğunu gösterir. Geleneksel olarak 0.33’ün altındaki ilişkiler zayıf, 0.34-0.60 civarındaki ilişkiler orta, 0.61 ve daha yüksek ilişkilerin ise güçlü olduğu varsayılır.
3. Goodman’ın Lambdası λ= 𝑗=1 𝑟 𝑓 𝑗 − 𝐹 𝑚 𝑛− 𝐹 𝑚 λ= 𝑗=1 𝑟 𝑓 𝑗 − 𝐹 𝑚 𝑛− 𝐹 𝑚 𝑓 𝑗 : Bağımsız değişkenin düzeylerinde gözlenen en yüksek frekansların toplamı 𝐹 𝑚 : Bağımlı değişkenin mod (tepe değer) frekans değeri n: Toplam gözlem sayısı Bağımsız değişkenin bağımlı değişkeni tahmin etmede yüzde kaç başarılı olduğunu veren bir katsayıdır. 0 ile 1 arasında değişir. Simetrik lamda ise değişkenler arasında bağımlı bağımsız ayırmı yapmaz ve çift yönlü tahmin güçlerini verir. İlişkinin 0 olması, A’nın B’yi tahmin etmede hiçbir değerinin olmadığını, 1 ise B değişkeninin A değişkeni ile mükemmel bir şekilde tahmin edilebileceğini göstermektedir.
4. Belirsizlik Katsayısı (Uncertainty Coefficient) Bu katsayı, Lamda katsayısı ile benzerdir. Elde edilen değer, bireyin bağımsız değişkendeki konumunun bilindiği duruma dayalı olarak hatadaki azalmanın tahminini verir. Bağımlı değişkendeki belirsizliğin ne kadarının bağımsız değişken bilgisi tarafından azaltıldığını ölçer. Söz konusu katsayı, 0 ve 1 arasında yer alır. Katsayının 0 değerini alması tamamen belirsizliği; 1 değerini alması tamamen belirliliği ifade eder.
Sıralama-Sıralama Ölçme Düzeyindeki Değişkenlerde Kullanılan İlişki Katsayıları 1. Gamma Katsayısı 𝛾= 𝑈−𝑇 𝑈+𝑇 U: Çapraz tablodaki her bir hücredeki frekansın sağında ve altında kalan frekansların toplamı ile çarpılması sonucu elde edilen değerlerin toplamıdır. T: Çapraz tablodaki her bir hücredeki frekansın solunda ve altında kalan frekansların toplamı ile çarpılması sonucu elde edilen değerlerin toplamıdır. -1 ile 1 arasında değerler alır ve genelde tau-b ve c den daha yüksek değerler verir.
Goodman ve Kruskal Gamma olarak da bilinir Goodman ve Kruskal Gamma olarak da bilinir. iki değişken arasında monotonik (değişkenler arasındaki doğru ya da ters orantı) bir ilişki olup olmadığını anlamakta kullanılan bir ilişki ölçüsüdür. İki sıralama ölçme düzeyinde değişken arasında ölçüm ilişkinin simetrik bir ölçüsüdür. Genellikle 2x2 boyutundaki çapraz tablolar için elde edilmesine rağmen satır ya da sütun sayısının üç ve daha fazla olduğu tablolar için de elde edilebilir.
2. Somer’in d Katsayısı Gamma nın geliştirilmiş halidir. -1 ile 1 arasında değerler alır. Gamma, Ta-b, Tau-c ve Spearman katsayıları simetriktirler ve değişkenler için bağımlı-bağımsız ayrımı yoktur. d katsayısı simetrik olmadığından bağımlı-bağımsız ayrımı vardır. Bağımsız ve bağımlı değişkenler yer değiştirirse farklı d katsayıları elde edilir. Satır ve sütunlarda sıfırdan farklı en az iki hücre frekansının bulunması durumunda d katsayıları hesaplanabilir. d katsayısı -1 ile +1 arasında değişim gösterir. X ve Y değişkenleri birbirinden bağımsız olduğunda 𝑑 𝑌𝑋 = 𝑑 𝑋𝑌 =0. Bununla birlikte bu katsayılar sıfır olduğunda (2x2 boyutundaki tablolar hariç) bağımsızlığın olduğu kesin değildir. -1 negatif tam ilişkiyi +1 ise pozitif tam ilişkiyi gösterir. 𝑑 𝑌𝑋 ve 𝑑 𝑋𝑌 katsayılarının mutlak değerleri, gamma katsayısının mutlak değerine eşit veya küçüktür. Tau-b katsayısı, d katsayılarının geometrik ortalamasıdır.
3. Kendall’ın tau-b Katsayısı Genellikle 2x2 tablolar için kullanılması tavsiye edilir ve -1 ile 1 arasında değer alır. Karesel tablolar için uygundur. Eş gözlemler arasında bir uyumluluk (concordance) veya bağımlılık olup olmadığını analiz eder. Karesel veya karesel olmayan tablolar için istatistiksel bağımsızlık olduğunda 0 değerini alırken; sadece karesel tablolar için tüm değerler tek bir köşegende yer alıyorsa, 1 veya -1 değerini alır. 4. Kendall’ın tau-c Katsayısı Satır ve sütun sayısının eşit olmadığı kontenjans tablolarında Kendall'ın tau-b katsayısı alması gereken maksimum değerler olan -1 ve 1 değerlerine ulaşamaz. Karesel olmayan tablolar için kullanılır ve -1 ile 1 arasında değer alır.
Değişkenlerden Biri Sınıflama Diğeri En Az Eşit Aralıklı Olduğunda Kullanılan İlişki Katsayısı Eta Katsayısı: Değişkenlerden biri nominal diğeri ise eşit aralıklı olduğunda iki değişken arasındaki ilişkinin düzeyini gösterir. Alabileceği değerler 0.00 ile 1.00 arasında değişmektedir. 0.00 iki değişken arasında hiçbir ilişkinin olmadığını gösterirken, 1.00 iki değişken arasındaki ilişkinin doğrusallığının mükemmel olduğunu gösterir. Geleneksel olarak 0.33’ün altındaki ilişkiler zayıf, 0.34- 0.60 civarındaki ilişkiler orta, 0.61 ve daha yüksek ilişkilerin ise güçlü olduğu varsayılır.