İlişki Ölçüleri
Bu bölümde biri bağımlı ve diğeri bağımsız olan iki değişken arasındaki bir ilişki olup olmadığı ve ilişkinin yönü ve kuvveti incelenecektir.
Bağımlı ve Bağımsız Değişkenler Sürekli Olduğunda İlişki Katsayısı İki değişken arasındaki ilişkiler değişik yapılarda ortaya çıkabilir. Örneğin bazı ilişkiler doğrusal iken bazıları doğrusal değildir. Daha önceki derslerde iki değişken arasındaki ilişkilerin grafikler yardımı ile nasıl incelenebileceği konusu üzerinde durulmuştu.
Sürekli ve kesikli iki değişken arasındaki ilişkinin yapısı konusunda bilgi edinebilmenin en iyi yolu saçılım grafiklerinden yararlanmaktır.
Ağırlık-BKI düzeyi İlişkisi Örnek 1: Ağırlık-BKI düzeyi İlişkisi Ağırlık (x) BKI (y) 64.0 22.1 75.3 24.5 73.0 23.8 82.1 26.8 76.2 25.3 . 77.6 28.6
Hizmet edilen hasta sayısı ile birim başına yemek maliyeti ilişkisi Örnek 2: Hizmet edilen hasta sayısı ile birim başına yemek maliyeti ilişkisi
İki değişkene ilişkin doğrusal ilişkilerde eğer bir değişkenin değerleri artarken diğer değişkenin değerleri de artıyorsa ya da bir değişkenin değerleri azalırken diğer değişkenin değerleri de azalıyorsa, değişkenler arasında pozitif ilişki vardır. Pozitif Zayıf İlişki Pozitif Kuvvetli İlişki Pozitif Tam İlişki
POZİTİF ZAYIF İLİŞKİ
POZİTİF KUVVETLİ İLİŞKİ
POZİTİF TAM İLİŞKİ
İki değişkene ilişkin doğrusal ilişkilerde eğer bir değişkenin değerleri artarken diğer değişkenin değerleri de azalıyorsa ya da bir değişkenin değerleri azalırken diğer değişkenin değerleri de artıyorsa, değişkenler arasında negatif ilişki vardır. Negatif Zayıf İlişki Negatif Kuvvetli İlişki Negatif Tam İlişki
NEGATİF ZAYIF İLİŞKİ
NEGATİF KUVVETLİ İLİŞKİ
NEGATİF TAM İLİŞKİ
İLİŞKİSİZLİK
Pearson İlişki (Korelasyon) Katsayısı (r) Ölçümle belirtilen iki değişken arasındaki doğrusal ilişkinin kuvveti (derecesi) ve yönü hakkında bilgi verir. arasında değişir. İlişki Azalır -1 +1 İlişki artar
İlişkiler aşağıdaki gibi nitelendirilebilir. İlişkinin derecesi 0.90 to 1.00 Çok kuvvetli 0.70 to 0.89 Kuvvetli 0.50 to 0.69 Orta 0.30 to 0.49 Düşük 0.00 to 0.29 Zayıf
r’nin Hesaplanması
r’nin Anlamlılığı Korelasyon katsayısının (r) anlamlı olup olmadığı (sıfırdan farklı olup olmadığı) t dağılımı yardımı ile test edilebilir.
Karşılaştırma Hesapla bulunan t istatistiği, belirlenen yanılma düzeyinde n-2 serbestlik dereceli t tablo istatistiği ile karşılaştırılır. tHesap>tTablo ise iki değişken arasındaki ilişkinin sıfırdan farklı olduğu söylenir.
Ağırlık-BKI İlişkisi Örnek 1: (devam) 64.0 22.1 75.3 24.5 73.0 23.8 (x) BKI (y) 64.0 22.1 75.3 24.5 73.0 23.8 82.1 26.8 76.2 25.3 . 77.6 28.6
Ağırlık-BKI İlişkisi
İLİŞKİ( KORELASYON) MATRİSİ AĞIRLIK BKI AĞIRLIK 1,0000 0,83 BKI
Anlamlılığın Test Edilmesi 2. Test istatistiğinin elde edilmesi. Hipotezlerin Kurulması. H0: İki değişken arasında ilişki yoktur (=0). H1: İki değişken arasında pozitif ilişki vardır (>0)
3. Yanılma düzeyi alfa=0.05 alınmıştır. 4. Karar için: Sd=n-2=15-2=13’tür. 13 serbestlik dereceli tek yönlü t tablo istatistiği 1.77 olarak bulunur. Karar: tHesap=5.39>tTablo=1.77 olduğu için H0 hipotezi reddedilir ve r’nin sıfırdan büyük bir değer olduğu söylenir (p<0.05).
Açıklayıcılık Katsayısı (R2) Açıklayıcılık (belirtme) katsayısı (R2), değişkenleri bağımlı-bağımsız değişken olarak düşündüğümüzde bağımlı değişkendeki toplam değişimin yüzde kaçının bağımsız değişken tarafından açıklanabildiğini belirtir.
R2=r2 İki değişken arasında doğrusal ilişki olması durumunda, korelasyon katsayısının karesi açıklayıcılık katsayısına eşittir. R2=r2 R2 değeri 0 ile +1 arasında değişir. R2 değerinin 1’e yaklaşması, bağımlı değişkendeki değişimin büyük bir bölümünün bağımsız değişken tarafından açıklandığını gösterir.
Örneğimiz için R2 R2=r2=0.832=0.69 Buna göre ağırlık değişkeni, beden kitle indeksindeki değişimin % 69’unu açıklamaktadır. Beden kitle indeksindeki değişimin % 31’i (1-0.69) dikkate alınmayan başka değişkenlerce açıklanmaktadır.
Diğer Korelasyon Katsayıları Spearman Sıra Korelasyon Katsayısı (rs) Phi katsayısı
Spearman Sıra Korelasyon Katsayısı (rs) Pearson korelasyon katsayısının parametrik olmayan karşılığıdır. Değişkenlerin biri ya da her ikisinin normal dağılmadığı durumlarda kullanılabileceği gibi doğrudan sıralı (ordinal) olarak elde edilen ya da belli bir kritere göre sıralanmış olan iki değişkenin ilişki miktarını belirlemek amacı ile de kullanılır.
rs’nin hesaplanması ve anlamlılığı için t istatistiğinin bulunması
Örnek 3: 7-9 yaş çocuklarda günlük içtikleri süt miktarı ile serum kalsiyum düzeyleri arasındaki ilişkinin incelenmesi
Süt miktarı (bardak) (x) Serum kalsiyum düzeyi (mg/dL) (y) Sıra Süt mik. Sıra d 3 8 5 3.5 1,5 8.6 6 -1 9 7.5 7 0.5 10.5 9.2 -0.5 11 10 2 2.5 -1,0 8.3 1
H0: İki değişken arasında ilişki yoktur (ρS=0). H1: İki değişken arasında pozitif ilişki vardır (ρS>0). α=0.05, n=10 serbestlik dereceli tek yönlü t tablo değeri 1.81’dir. 9.69>1.81 olduğu için günlük içilen süt miktarı ile serum kalsiyum düzeyleri arasında pozitif bir ilişki vardır.
Phi Katsayısı 4 gözlü çapraz tablolarda uygulanır. Pearson korelasyon katsayısı (r) gibi yorumlanır. Ki-kare istatistiği anlamlı ise Phi katsayısı da anlamlıdır.
Örnek 4: Aşağıda ilkokul çağındaki çocukların, beslenme durumlarına göre okuldaki başarı durumları verilmiştir.
Aynı soruda bireylerin dağılımı aşağıdaki gibi olsaydı;
R E G R E S Y ON Ç Ö Z Ü M L E M E S İ Dr. R. ALPAR
REGRESYON ÇÖZÜMLEMESİ İki değişken arasındaki korelasyon katsayısı yeterince büyükse, kolay elde edilen bir x değişkeni değeri yardımıyla elde edilmesi zor olan bir y değişkeni değeri kestirilebilir. Bu kestirim regresyon çözümlemesi yardımıyla yapılır.
REGRESYON Basit doğrusal regresyon Çoklu doğrusal regresyon
basit doğrusal regresyon çözümlemesi Bir bağımlı bir bağımsız değişkenin olduğu doğrusal regresyon çözümlemesine basit doğrusal regresyon çözümlemesi denir.
Örnek 5: Günlük İçilen Sigara Sayısı (GİSS)-Sistolik Kan Basıncı (SKB) İlişkisi Kişi no GİSS (x) SKB(y) 1 4 12 2 11 14 3 8 15 5 6 16 7 20 9 13 10
y=b0+b1x y ve x gibi iki değişken arasındaki doğrusal ilişki ile verilir.
Değişken Adları Regresyon çözümlemesinde: x değişkeni: genellikle bağımsız değişken ya da etkileyen değişken olarak adlandırılır ve x ile gösterilir. y değişkeni: x değişkenine bağlı olarak değiştiği düşünüldüğü için bağımlı değişken, açıklanan değişken ya da etkilenen değişken gibi adlar alır.
b0 ve b1 Katsayılarının Tanımı b0 : Regresyon doğrusunun y eksinini kestiği nokta olup kesim noktası ya da sabit olarak adlandırılır. b1: Regresyon katsayısıdır ve x’de bir birimlik değişme olduğunda y’de meydana gelecek ortalama değişlik miktarını verir.
b0 ve b1’in Bulunması
Günlük içilen sigara sayısı(x) Sistolik kan basıncı(y) ÖRNEK 5:(devam) Günlük içilen sigara sayısı(x) Sistolik kan basıncı(y) 4 12 11 14 8 15 5 16 20 9 13 2 10
b0= 10.004 b1= 0.277
r=0.903 R2=0.9032=0.815 SONUÇLARIN SUNULMASI Değişken Katsayı KATSAYILARA İLİŞKİN İSTATİSTİKLER Değişken Katsayı Standart hata t p Sabit 10.004 0.574 17.425 0.000 x 0.277 0.050 5.561 0.001
DK KT Sd KO F P Toplam 27.556 8 Regresyon 22.469 1 30.923 0.001 Artık VARYANS ANALİZİ TABLOSU DK KT Sd KO F P Toplam 27.556 8 Regresyon 22.469 1 30.923 0.001 Artık 5.086 7
Regresyon Doğrusunun Çizimi * *
ÇOKLU DOĞRUSAL REGRESYON ÇÖZÜMLEMESİ Amaç: Kolay elde edilebilir bağımsız değişkenler yardımıyla zor elde edilen bağımlı değişken değerini kestirmek Bağımsız değişkenlerden hangisi ya da hangilerinin bağımlı değişkeni daha çok etkilediğini belirlemek
Çoklu Doğrusal Regresyon Modeli
Değişkenlerin Tanımı Bağımlı değişken sürekli ya da kesikli sayısal veri tipinde olmalıdır. Bağımsız değişkenler sürekli kesikli ya da nitelik veri tipinde olabilir. Nitelik bağımsız değişkenler olduğunda göstermelik (dummy) değişkenler oluşturulur.
Gözlem Sayısı Gözlem sayısı (n), bağımsız değişken sayısının en az 10 katı olmalıdır. İdeali ise, gözlem sayısının bağımsız değişken sayısının 20 katı olmasıdır. Bazı çalışmalarda sayı 40 katına kadar çıkmaktadır.
Uyarılar Bağımsız değişkenler arasındaki korelasyon katsayıları yüksek olmamalıdır.Yüksek ilişki çoklubağlantıya neden olur. Büyük R2 ya da F istatistiğinin anlamlı olması modelin yeterliği ve geçerliği konusunda ayrıntılı bilgi vermez. Artıkların incelenmesi gereklidir.
y: Ortalama artelyel kan basıncı (mm Hg) x1: Yaş (yıl) Örnek 6: Hipertansiyon hastası olan 120 kişiye ilişkin kan basıncını etkileyen faktörlerin incelenmesi y: Ortalama artelyel kan basıncı (mm Hg) x1: Yaş (yıl) x2: Ağırlık (kg) x3: Vücut Yüzeyi Alanı (m2) x4: Yüksek tansiyon hikayesi Süresi (yıl) x5: Bazal kalp atım hızı (atış/dk) x6: Stres ölçüsü
Çocuğun Doğum Ağırlığı (y) Gebelik haftası (x1) Örnek 7: Çocuğun Doğum Ağırlığı (y) Gebelik haftası (x1) Annenin sigara içme durumu (x2) y (gr) x1 x2 3940 38 1 3130 2420 36 2450 34 2740 2841 . 3222 39