SPSS’TE ÇAPRAZ TABLO Çapraz tablo temel olarak, iki kategorik değişken arasındaki ilişkiyi analiz etmek için kullanılır. Örneğin cinsiyet ve oy verilen.

Slides:



Advertisements
Benzer bir sunumlar
Hâsılat kavramları Firmaların kârı maksimize ettikleri varsayılır. Kâr toplam hâsılat ile toplam maliyet arasındaki farktır. Kârı analiz etmek için hâsılat.
Advertisements

Determinant Bir kare matrisin tersinir olup olmadığına dair bilgi veriyor n- boyutlu uzayda matrisin satırlarından oluşmuş bir paralel kenarın hacmine.
HİPOTEZ TESTLERİNE GİRİŞ 1. Şu ana kadar örneklemden elde edilmiş istatistiklerden yararlanarak, kitle parametresini kestirebilmek için nokta tahmini.
İKİ ÖRNEKLEM TESTLERİ. BAĞIMSIZ GRUPLARA İLİŞKİN HİPOTEZ TESTLERİ.
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ. BAĞIMSIZ GRUPLARA İLİŞKİN HİPOTEZ TESTLERİ.
Çapraz Tablolar Tek ve İki Değişkenli Grafikler.  Çapraz Tablo ve Diğer Tabloları Oluşturabilmek  Bu Tablolara Uygun Grafikleri Çizebilmek Amaç:
Zihinsel engellilerin sınıflandırılması
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri Mann-Whitney U testi Wilcoxon İşaretli Sıra testi BBY252 Araştırma.
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
HİPOTEZ TESTLERİNE GİRİŞ Şu ana kadar örneklemden elde edilmiş istatistiklerden yararlanarak, kitle parametresini kestirebilmek için nokta tahmini.
ÇOK BOYUTLU SİNYAL İŞLEME
OLASILIK ve İSTATİSTİK
Çoklu Doğrusal Bağlantı X3X3 X2X2 r X 2 X 3 = 1 Tam Çoklu Doğrusal Bağlantı.
Regresyon Analizi Hanefi Özbek.
VERİLERİN ANALİZİ Öğr. Gör. Funda Veren.
Istatistik I Fırat Emir.
Ölçme Değerlendirmede İstatistiksel İşlemler
İstatistiksel Testler
HİPOTEZ TESTLERİ VE Kİ-KARE ANALİZİ
Sıklık Dağılımları Yrd. Doç. Dr. Emine Cabı.
BİLİMSEL ARAŞTIRMA YÖNTEMLERİ ÜNİTE 3
Kategorik Veri İki Bağımlı Grup
TAM SAYILAR.
T- Testİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ
Basit ve Kısmi Korelasyon Dr. Emine Cabı
DENEYSEL TERTİPLER VE PAZAR DENEMESİ
Deneme Modelleri Neden-sonuç ilişkilerinin sorgulandığı araştırma türleridir. Deneme ve tarama modelleri arasındaki fark nedir? Deneme modellerinde amaçlar.
Kİ-KARE DAĞILIMI VE TESTİ
Yapay Sinir Ağı Modeli (öğretmenli öğrenme) Çok Katmanlı Algılayıcı
MODEL YETERSİZLİKLERİNİ DÜZELTMEK İÇİN DÖNÜŞÜMLER VE AĞIRLIKLANDIRMA
İstatistiksel Analizler
Yrd. Doç. Dr. Mustafa Akkol
Parametrik Olmayan (Non-parametrik) Testler
Ünite 9: Korelasyon Öğr. Elemanı: Dr. M. Cumhur AKBULUT.
TANIMLAYICI İSTATİSTİKLER
İŞ SAĞLIĞI VE GÜVENLİĞİ KARŞILAŞTIRMA ÖLÇÜTLERİ
TEST VE MADDE İSTATİSTİKLERİ
KORELASYON VE DOGRUSAL REGRESYON
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
İSTATİSTİK Yrd. Doç. Dr. Cumhur TÜRK
Bağımlı (Eşleştirilmiş) Örneklerde t-Testi (Paried Sample t test) Menüsü Bağımlı örnekler için deney tasarımı iki farklı biçimde karşımıza çıkmaktadır.
SİSMİK PROSPEKSİYON DERS-3
Prof.Dr.Şaban EREN Yasar Üniversitesi Fen-Edebiyat Fakültesi
385 kişiye yapılan anket soruları aşağıdaki verilmiştir.
PARAMETRİK HİPOTEZ TESTLERİ
Dr. İLKER YAKIN & Dr. HASAN TINMAZ
NİŞANTAŞI ÜNİVERSİTESİ
NİŞANTAŞI ÜNİVERSİTESİ
NİŞANTAŞI ÜNİVERSİTESİ
Ölçme Değerlendirmede İstatistiksel İşlemler
ÖLÇEKLER ÖLÇMEDE HATA KORELASYON
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
SPSS’TE ÇAPRAZ TABLO Çapraz tablo temel olarak, iki kategorik değişken arasındaki ilişkiyi analiz etmek için kullanılır. Örneğin cinsiyet ve oy verilen.
ÖLÇME-DEĞERLENDİRME 1.DERS
Tezin Olası Bölümleri.
NİŞANTAŞI ÜNİVERSİTESİ
İletişim Fakültesi Bilişim A.B.D.
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
HİPOTEZ TESTLERİ.
PSİKOLOJİDE ARAŞTIRMA YÖNTEMLERİ
5.Hafta Varyans Analizi -ANOVA
Veri ve Türleri Araştırma amacına uygun gözlenen ve kaydedilen değişken ya da değişkenlere veri denir. Olgusal Veriler Yargısal Veriler.
DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA
Dönem 2 Biyoistatistik Uygulama
Nimet IŞIK Mehmet Akif Ersoy Üniversitesi İlköğretim Bölümü
OLASILIK Uygulamada karşılaşılan olayların birçoğu kesin olmayan diğer bir ifadeyle belirsizlik içeren bir yapıya sahiptir. Olasılık kavramı kesin olmayan.
RASTGELE DEĞİŞKENLER Herhangi bir özellik bakımından birimlerin almış oldukları farklı değerlere değişken denir. Rastgele değişken ise tanım aralığında.
Bilimsel Araştırma Yöntemleri
Bilimsel araştırma türleri (Deneysel Desenler)
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
Sunum transkripti:

SPSS’TE ÇAPRAZ TABLO Çapraz tablo temel olarak, iki kategorik değişken arasındaki ilişkiyi analiz etmek için kullanılır. Örneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi. Çapraz tablolar izlenen amaca göre üç türlü yapılmaktadır. (Darcy ve Rohrs, 1995) Bir değişkenin bir başka değişken üzerindeki etkisini göstermek (yüzdelemenin yönü eğer satır -yatay yönündeki- değişkeni bağımsız değişken ise bu yönde, yok eğer bağımsız değişken sütün – dikey yönündeki- değişkeni ise bu yönde yapılır).

Analyze → Descriptive Statistics → Crosstabs… Bir grubun komposizyonunu (dağılımını) belirlemek için. Çaprazlanan değişkenler sonucu ortaya çıkan olası alt grupların bütün içindeki komposizyonunu belirlemek için. Örneğin cinsiyet ile gelir düzeyi arasındaki ilişkiyi gösteren çapraz tablonun oluşturulmasında SPSS’te aşağıdaki adımlar uygulanır. Analyze → Descriptive Statistics → Crosstabs…

Cells… menüsünde aşağıdaki kısımlar işaretlenir.

Gelir düzeyi ile Türkiye için gelecek beklentisi arasındaki çapraz tablo sonuçları ise şöyledir:

Kİ-KARE BAĞIMSIZLIK TESTİ Uygulamalı çalışmalarda değişkenlerin büyük bir bölümü sınıflama ya da sıralama ölçme düzeyinde nitel değişkenlerdir. Eğer iki değişken arasında ilişki yoksa bu iki değişkenin bağımsız olduğu söylenebilir. İki değişken bağımsız ise değişkenlerden birinin değerini bilmek, diğer değişkenin alacağı değeri tahmin etmemize yardımcı olmaz. Sınıflama ya da sıralama ölçme düzeyinde gözlemlenmiş iki değişken arasındaki ilişki Ki-kare ( 𝜒 2 )bağımsızlık testi ile araştırılabilir.

𝜒 2 bağımsızlık testinde çapraz tablonun oluşturulması önemli bir yer tutar. Bu tablonun oluşturulmasında öncelikle değişkenlerin kaç farklı değer alacağı saptanır. Birinci değişken (𝑋 1 ) düzeyleri 𝑐 ve ikinci değişken (𝑋 2 ) 𝑟 düzeyli olsun. Bu durumda 𝑛 𝑖𝑗 : 𝑋 1 değişkeninin 𝑖. ve 𝑋 2 değişkeninin 𝑗. düzeyindeki örnek birimlerinin sayısı (Gözlenen frekanslar) 𝑛 .𝑖 : 𝑋 1 değişkeninin 𝑖. düzeyindeki örnek birimlerinin sayısı 𝑛 𝑗. : 𝑋 2 değişkeninin 𝑗. düzeyindeki örnek birimlerinin sayısı Gözlenen frekanslar 𝐺 𝑖𝑗 = 𝑛 𝑖𝑗 ile gösterilirsin.

𝐻 0 :Değişkenler bağımsızdır. 𝐻 1 :Değişkenler bağımsız değildir 𝐻 0 :Değişkenler bağımsızdır. 𝐻 1 :Değişkenler bağımsız değildir. 𝜒 2 bağımsızlık testi gözlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir. İki değişken bağımsız ise 𝑖. satır ve 𝑗. sütunda yer alan hücre için beklenen frekans 𝐵 𝑖𝑗 𝐵 𝑖𝑗 = 𝑛 .𝑖 × 𝑛 𝑗. 𝑛 şeklinde hesaplanır. 𝐻 0 hipotezi doğru iken test istatistiği 𝜒 ℎ 2 = 𝑖=1 𝑐 𝑗=1 𝑟 𝐺 𝑖𝑗 − 𝐵 𝑖𝑗 2 𝐵 𝑖𝑗

Bu test istatistiği 𝑐−1 𝑟−1 serbestlik dereceli 𝜒 2 dağılımına sahiptir. Yukarıda tanımlanan 𝜒 ℎ 2 değeri, araştırmacı tarafından önceden belirlenen 1. tip hata düzeyine 𝛼 karşılık gelen 𝜒 2 tablo değeri ile karşılaştırılarak 𝐻 0 hipotezi test edilir. 𝜒 ℎ 2 > 𝜒 𝑇𝑎𝑏𝑙𝑜 2 ise 𝐻 0 hipotezi reddedilebilir. 𝜒 ℎ 2 ≤ 𝜒 𝑇𝑎𝑏𝑙𝑜 2 ise 𝐻 0 hipotezi reddedilemez.

𝜒 ℎ 2 = 𝑖=1 𝑐 𝑗=1 𝑟 𝐺 𝑖𝑗 − 𝐵 𝑖𝑗 −0.5 2 𝐵 𝑖𝑗 Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar Beklenen frekanslar 1’den küçük olmamalıdır. Beklenen frekansların en fazla %20’si 5’den daha küçük olabilir. Bu koşullar sağlanmadığında Örnek çapı arttırılabilir Satırlar veya sütunlar birleştirilebilir (iii) Her iki değişken için düzeylerin 2 olması durumunda (2×2) Yates düzeltmesi yapılmalıdır. 𝜒 ℎ 2 = 𝑖=1 𝑐 𝑗=1 𝑟 𝐺 𝑖𝑗 − 𝐵 𝑖𝑗 −0.5 2 𝐵 𝑖𝑗

Örnek 1. Eğitim düzeyi ile gelir düzeyi arasında %5 anlamlılık düzeyinde ilişki var mıdır?

𝐻 0 : Eğitim düzeyi ile gelir düzeyi arasında ilişki yoktur 𝐻 0 : Eğitim düzeyi ile gelir düzeyi arasında ilişki yoktur. 𝐻 1 : Eğitim düzeyi ile gelir düzeyi arasında ilişki vardır. Yukarıdaki tabloda 𝐻 0 hipotezinin testinde Pearson Chi-Square değerine bakılır. 𝜒 ℎ 2 =52.829 ve p-değeri=0.000<0.05 olduğundan ‘Eğitim düzeyi ile gelir düzeyi arasında ilişki yoktur’ sıfır hipotezi reddedilebilir.

Örnek 2. Cinsiyet ile yaşanılan yer arasında %5 anlamlılık düzeyinde ilişki var mıdır? 𝐻 0 : Cinsiyet ile yaşanılan yer arasında ilişki yoktur. 𝐻 1 : Cinsiyet ile yaşanılan yer arasında ilişki vardır.

Çapraz tablo 2×2 olduğundan Pearson Chi-Square değeri yerine Continuity Correction (Yates Düzeltmeli 𝜒 ℎ 2 ) katsayısına bakılır. 𝜒 ℎ 2 =0.629ve p-değeri=0.426>0.05 olduğundan ‘Cinsiyet ile yaşanılan yer arasında ilişki yoktur’ sıfır hipotezi reddedilememektedir. Çapraz tablo 2×2 olduğunda ve 5’den küçük beklenen frekansların sayısı %20’den büyük olduğunda birleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır.

İLİŞKİ KATSAYILARI Sınıflama-Sınıflama Ölçme Düzeyindeki Değişkenlerde Kullanılan İlişki Katsayıları 1. Olağanlık katsayısı (Contingency Katsayısı) C= 𝜒 2 𝑛+ 𝜒 2 Bu katsayı değişkenlerin her ikisi de 3 ve 3 den fazla kategorili karesel tablolarda kullanılır. 0 ile 1 arasında değer alır. İlişki katsayısı tablonun boyutundan etkilenir. Boyut arttığında katsayının düzeltilip yorumlanması gerekir. Değişkenler arasındaki ilişki tam olduğunda dahi olağanlık katsayısı 0.707 olarak elde edilir.

2. Phi (𝜙) ϕ= χ 2 n Çapraz tablo 2×2 olduğunda kullanılır 2. Phi (𝜙) ϕ= χ 2 n Çapraz tablo 2×2 olduğunda kullanılır. Alabileceği değerler 0.00 ile 1.00 arasında değişmektedir. 0.00 iki değişken arasında hiçbir ilişkinin olmadığını gösterirken, 1.00 iki değişken arasındaki ilişkinin doğrusallığın mükemmel olduğunu gösterir. Geleneksel olarak 0.33’ün altındaki ilişkiler zayıf, 0.34-0.60 civarındaki ilişkiler orta, 0.61 ve daha yüksek ilişkilerin ise güçlü olduğu varsayılır.

3. Cramer 𝜐 Katsayısı 𝜐= χ 2 n 𝑘−1 𝑘: Matristeki en küçük satır veya sutun sayısı İki değişkenin kategori sayıları birbirine denk değildir. Matris 2x3, 3x5 gibidir. Tablonun boyutundan etkilenmez. Alabileceği değerler 0.00 ile 1.00 arasında değişmektedir. 0.00 iki değişken arasında hiçbir ilişkinin olmadığını gösterirken, 1.00 iki değişken arasındaki ilişkinin doğrusallığının mükemmel olduğunu gösterir. Geleneksel olarak 0.33’ün altındaki ilişkiler zayıf, 0.34-0.60 civarındaki ilişkiler orta, 0.61 ve daha yüksek ilişkilerin ise güçlü olduğu varsayılır.

3. Goodman’ın Lambdası λ= 𝑗=1 𝑟 𝑓 𝑗 − 𝐹 𝑚 𝑛− 𝐹 𝑚 λ= 𝑗=1 𝑟 𝑓 𝑗 − 𝐹 𝑚 𝑛− 𝐹 𝑚 𝑓 𝑗 : Bağımsız değişkenin düzeylerinde gözlenen en yüksek frekansların toplamı 𝐹 𝑚 : Bağımlı değişkenin mod (tepe değer) frekans değeri n: Toplam gözlem sayısı Bağımsız değişkenin bağımlı değişkeni tahmin etmede yüzde kaç başarılı olduğunu veren bir katsayıdır. 0 ile 1 arasında değişir. Simetrik lamda ise değişkenler arasında bağımlı bağımsız ayırmı yapmaz ve çift yönlü tahmin güçlerini verir. İlişkinin 0 olması, A’nın B’yi tahmin etmede hiçbir değerinin olmadığını, 1 ise B değişkeninin A değişkeni ile mükemmel bir şekilde tahmin edilebileceğini göstermektedir.

4. Belirsizlik Katsayısı (Uncertainty Coefficient) Bu katsayı, Lamda katsayısı ile benzerdir. Elde edilen değer, bireyin bağımsız değişkendeki konumunun bilindiği duruma dayalı olarak hatadaki azalmanın tahminini verir. Bağımlı değişkendeki belirsizliğin ne kadarının bağımsız değişken bilgisi tarafından azaltıldığını ölçer. Söz konusu katsayı, 0 ve 1 arasında yer alır. Katsayının 0 değerini alması tamamen belirsizliği; 1 değerini alması tamamen belirliliği ifade eder.

Sıralama-Sıralama Ölçme Düzeyindeki Değişkenlerde Kullanılan İlişki Katsayıları 1. Gamma Katsayısı 𝛾= 𝑈−𝑇 𝑈+𝑇 U: Çapraz tablodaki her bir hücredeki frekansın sağında ve altında kalan frekansların toplamı ile çarpılması sonucu elde edilen değerlerin toplamıdır. T: Çapraz tablodaki her bir hücredeki frekansın solunda ve altında kalan frekansların toplamı ile çarpılması sonucu elde edilen değerlerin toplamıdır. -1 ile 1 arasında değerler alır ve genelde tau-b ve c den daha yüksek değerler verir.

Goodman ve Kruskal Gamma olarak da bilinir Goodman ve Kruskal Gamma olarak da bilinir. iki değişken arasında monotonik (değişkenler arasındaki doğru ya da ters orantı) bir ilişki olup olmadığını anlamakta kullanılan bir ilişki ölçüsüdür. İki sıralama ölçme düzeyinde değişken arasında ölçüm ilişkinin simetrik bir ölçüsüdür. Genellikle 2x2 boyutundaki çapraz tablolar için elde edilmesine rağmen satır ya da sütun sayısının üç ve daha fazla olduğu tablolar için de elde edilebilir.

2. Somer’in d Katsayısı Gamma nın geliştirilmiş halidir. -1 ile 1 arasında değerler alır. Gamma, Ta-b, Tau-c ve Spearman katsayıları simetriktirler ve değişkenler için bağımlı-bağımsız ayrımı yoktur. d katsayısı simetrik olmadığından bağımlı-bağımsız ayrımı vardır. Bağımsız ve bağımlı değişkenler yer değiştirirse farklı d katsayıları elde edilir. Satır ve sütunlarda sıfırdan farklı en az iki hücre frekansının bulunması durumunda d katsayıları hesaplanabilir. d katsayısı -1 ile +1 arasında değişim gösterir. X ve Y değişkenleri birbirinden bağımsız olduğunda 𝑑 𝑌𝑋 = 𝑑 𝑋𝑌 =0. Bununla birlikte bu katsayılar sıfır olduğunda (2x2 boyutundaki tablolar hariç) bağımsızlığın olduğu kesin değildir. -1 negatif tam ilişkiyi +1 ise pozitif tam ilişkiyi gösterir. 𝑑 𝑌𝑋 ve 𝑑 𝑋𝑌 katsayılarının mutlak değerleri, gamma katsayısının mutlak değerine eşit veya küçüktür. Tau-b katsayısı, d katsayılarının geometrik ortalamasıdır.

3. Kendall’ın tau-b Katsayısı Genellikle 2x2 tablolar için kullanılması tavsiye edilir ve -1 ile 1 arasında değer alır. Karesel tablolar için uygundur. Eş gözlemler arasında bir uyumluluk (concordance) veya bağımlılık olup olmadığını analiz eder. Karesel veya karesel olmayan tablolar için istatistiksel bağımsızlık olduğunda 0 değerini alırken; sadece karesel tablolar için tüm değerler tek bir köşegende yer alıyorsa, 1 veya -1 değerini alır. 4. Kendall’ın tau-c Katsayısı Satır ve sütun sayısının eşit olmadığı kontenjans tablolarında Kendall'ın tau-b katsayısı alması gereken maksimum değerler olan -1 ve 1 değerlerine ulaşamaz. Karesel olmayan tablolar için kullanılır ve -1 ile 1 arasında değer alır.

Değişkenlerden Biri Sınıflama Diğeri En Az Eşit Aralıklı Olduğunda Kullanılan İlişki Katsayısı Eta Katsayısı: Değişkenlerden biri nominal diğeri ise eşit aralıklı olduğunda iki değişken arasındaki ilişkinin düzeyini gösterir. Alabileceği değerler 0.00 ile 1.00 arasında değişmektedir. 0.00 iki değişken arasında hiçbir ilişkinin olmadığını gösterirken, 1.00 iki değişken arasındaki ilişkinin doğrusallığının mükemmel olduğunu gösterir. Geleneksel olarak 0.33’ün altındaki ilişkiler zayıf, 0.34- 0.60 civarındaki ilişkiler orta, 0.61 ve daha yüksek ilişkilerin ise güçlü olduğu varsayılır.