Korelasyon Analizi Yrd. Doç. Dr. İlknur KESKİN
Korelasyon (bağıntı, ilişki) analizi: İki ya da daha çok değişken arasında ilişki olup olmadığını, İlişki varsa bu ilişkinin yönünü ve gücünü inceleyen istatistiksel yöntemdir.
Regresyon analizi: Aralarında ilişki olan değişkenlerden birisi belirli bir birim değiştiğinde, diğerinin nasıl bir değişim gösterdiğini inceleyen istatistiksel yöntemdir. Yani eldeki verilerden kestirim yapabilme gücünü test eden yöntemdir.
Temel iki amacı vardır: 1) Değişkenler arası ilişkinin açıklanmasına yardımcı olmak, 2) Benzer sonuçları önceden tahmin etmek.
ilişki var mıdır? Korelasyon örnekleri Günlük sigara içme miktarı ile koroner arter çapı arasında, Hipertansiyon ile hasta yaşı arasında, Sınava hazırlanma süresi ile sınavdan alınan başarı arasında, Diş çürüğü ile günlük diş fırçalama sayısı arasında, Günde alınan kalori miktarı ile kilo kazanma arasında, ilişki var mıdır? Değişkenler arasındaki mevcut ilişkiyi betimlediği için betimleyici araştırma’dır.
Yukarıdaki soruların cevabı korelasyon analizi ile verilebilir. Bir bağıntı bulunacak olur ise bu durumda regresyon analizi ile inceleme devam ettirilir ve korelasyonun matematiksel ifadesi ortaya konur.
Dikkat edilmesi gereken önemli bir nokta ; Gerçekte iki değişken arasında ilişki olmamasına rağmen, analiz sonucunda bu iki değişken arasında ilişki varmış gibi bir sonuç elde edilebilir. Korelasyon ve regresyon analizi, değişkenler arasındaki ilişkinin neden-sonuç ilişkisi olup olmadığını göstermez.
"korelasyon nedensellik değildir" Korelasyon ve regresyon analizinde iki değişken arasında ilişki saptanırsa, bu ilişkinin neden-sonuç ilişkisi olup olmadığı mutlaka incelenmelidir. Ör: İskandinavya'da 19. yy sonu ve 20. yy için yıllık leylek sayısı ve yıllık bebek doğum sayısı incelenince çok yakın bir pozitif korelasyon bulunmaktadır. Bu bebeklerin leylekler tarafından getirildikleri önerisini doğurmaz. Hem doğum sayısı hem de leylek sayısı ekonomik gelişme ve şehirleşme dolayısı ile azalmış, bu iki azalma birinin diğerine sebep-sonuç olmasından ortaya çıkmamıştır.
basit korelasyon analizi: İki değişken arasındaki nda ilişkinin incelenmesi. çoklu korelasyon analizi: İkiden çok değişken arasında ilişkinin incelenmesi.
bağımsız değişkenler “x” ile sembolize edilir. bağımlı değişken “y” ile sembolize edilir.
Nokta (Serpme) Grafiği-Scatter Plot X ve Y değişkenleri arasında bir ilişki olup-olmadığını göstermek için bu değişkenlere ait nokta grafiği çizilir.
İki değişkenin değerleri arasında; Doğrusal Doğrusal olmayan türde ilişki olabilir.
Doğrusal İlişki Doğrusal ilişki ile anlatılmak istenen, iki değişken arasındaki ilişkinin bir doğru ile temsil edilebileceğidir. Sonuçta ortaya dört ayrı görüntü çıkabilir:
1. X arttıkça Y de artar / X azaldıkça Y de azalır: Pozitif doğrusal ilişki Ör: Sınava hazırlanma süresi - sınavdan alınan başarı
İlişkinin kuvvetine göre pozitif ilişkinin grafik üzerinde görünümü
2. X arttıkça Y azalır / X azaldıkça Y artar: Negatif doğrusal ilişki Ör: Günlük içilen sigara sayısı - koşulabilen mesafe
İlişkinin kuvvetine göre negatif ilişkinin grafik üzerinde görünümü
3. X artsa bile Y değişmez (sabit): İlişki yok
4. X’in artması Y’yi etkilemez: İlişki yok
Doğrusal Olmayan İlişki İki değişken arasındaki bağıntı her zaman doğrusal olmayabilir. Bazen doğrusal gibi başlayan bir bağıntı, doğrusal olmayan bir nitelik kazanabilir.
Ör: Bir bakteri türünün üretilmesi sırasında ortamın oksijen konsantrasyonu % 0.5 - % 10.0 arasında değiştirilerek bu bakterinin oksijen konsantrasyonuna verdiği cevap araştırılıyor. Elde edilen verilerle hazırlanmış grafiğe göre üreme hızı ile oksijen konsantrasyonu arasında bir ilişki var mıdır?
Sonuç: Oksijen konsantrasyonu ile bakteri üreme hızı arasında doğrusal olmayan bir bağıntı vardır.
basit korelasyon analizi Basit korelasyon analizinde iki değişken söz konusudur. Bu değişkenlerin bağımlı-bağımsız değişken olarak tanımlanması analiz için önemli değildir. Basit korelasyon analizi; iki değişken arasındaki ilişkinin düzeyini (derecesini-şiddetini-gücünü) ve yönünü belirlemek amacı ile yapılır.
KORELASYON (İLİŞKİ) KATSAYISI İki değişken arasındaki ilişkinin gücünü gösteren ölçü korelasyon katsayısıdır. “ r ” sembolü ile gösterilir. Değişkenler arasındaki ilişki; pozitif (aynı yönde) ise işareti “ + ” negatif (ters yönde) ise “ - ” olur. Korelasyon katsayısı, “ -1 ” ile “ +1 ” arasında herhangi bir değer alabilir (-1≤ r ≤+1).
İki değişken arasında pozitif tam bir ilişki varsa korelasyon katsayısı “ +1 ” , negatif tam bir ilişki varsa “ -1 ” , ilişki yoksa “ 0 ” olur. Korelasyon katsayısı; 0.0 - 0.50 arasında ise ilişkinin zayıf, 0.50 - 1.0 arasında ise ilişkinin kuvvetli olduğu kabul edilir.
Dikkat edilecek hususlar Sağlık bilimlerinde r=0.95’in üzerinde korelasyon katsayısı bulunması nadirdir. Böyle bir durumda hata yapılıp yapılmadığı kontrol edilmelidir. Birbiriyle ilgisiz değişkenlerin karşılaştırılmasından kaçınılmalıdır. Güney Amerika yerlilerinin besin alışkanlıkları ile Afrika timsahlarının boy uzunluğu arasında ilişki var mıdır?
İlişki katsayısının özellikleri Bağıntı katsayısı: Değişkenlerin ölçüldüğü birimden etkilenmez: Ör: Değişkenin cm veya mm cinsinden ölçülmesi. Simetrik bir ölçüttür: Nokta grafiği yapılırken değişkenlerden hangisinin X, hangisinin Y eksenine geldiği önemli değildir. Her durumda da aynı sonuç elde edilir. Sadece doğrusal ilişkinin derecesini belirtir. Doğrusal olmayan ama kuvvetli ilişkilerde bağıntı katsayısı küçük çıkabilir. Bağıntı katsayısının büyük olması, mantıksal bir nedene dayanmayan durumlarda bir anlam taşımaz (Güney Amerika yerlileri ile Afrika timsahları arasındaki ilişki gibi).
Ör: Kan kolesterol düzeyi ile koroner damarların çapı arasında bir ilişki olup olmadığı araştırılmak isteniyor. Koroner arter hastalığı tanısı ile anjiyografi yapılmış 30 hastada serum kolesterol düzeyi ölçülüyor. Anjiyografi sırasında aterosklerotik plağın bulunduğu yerde koroner arterin çapı ölçülüyor.
Sorular: Kolesterol düzeyi ile koroner arter çapı arasında bir ilişki var mıdır? Kolesterol düzeyi yüksek olan hastaların koroner arterleri, kolesterol düzeyi normal olan kişilere göre daha dar denilebilir mi?
Örneğe ait veriler Denek no Koroner arter çapı (mm) Kolesterol (mg/dL) 1 5 80 2 100 3 150 4 125 130 6 190 7 3,5 8 175 9 195 10 155 11 170 12 180 13 2,8 185 14 2,7 15 290 16 2,5 245 17 260 18 2,4 265 19 2,3 270 20 2,2 21 22 2,1 268 23 272 24 1,5 25 280 26 276 27 28 340 29 360 30 364 Örneğe ait veriler
Nokta Grafiği
İki değişken arasındaki ilişkinin incelenmesi sırasında, değişkenlere ilişkin toplanan verilerin türü önemlidir. Her iki değişkenin de sayısal (kantitatif) değişken olması ve değişkenlere ilişkin verilerin normal dağılım göstermesi durumunda değişkenler arasındaki ilişki Pearson korelasyon katsayısı ile belirlenir (parametrik test). Değişkenlerin değerleri sayısal değilse: Kendall’s tau veya Spearman korelasyon katsayısı kullanılmalıdır (non-parametrik test). Eğer değişkenler arasındaki ilişki doğrusal değil ise hesaplanan korelasyon katsayısı değişkenler arsındaki ilişkiyi ölçmek için uygun bir istatistik değildir.
Pearson correlation (Bağıntı analizi) -0.905: Zıt yönde, % 90.5’lik bir bağıntının var olduğunu gösterir. r=-0.905 olarak da gösterilir. Sig. (2-tailed): p değeri p=0.000: p<0.001 olarak da yorumlanabilir. Bağıntının istatistiksel olarak anlamlı olduğunu gösterir.
Sorular: Kolesterol düzeyi ile koroner arter çapı arasında bir ilişki var mıdır? Kolesterol düzeyi yüksek olan hastaların koroner arterleri, kolesterol düzeyi normal olan kişilere göre daha dar denilebilir mi? Cevaplar: Kolesterol düzeyi ile koroner arter çapı arasında negatif yönde ve doğrusal bir ilişki vardır (r=0.905, p<0.001). Kolesterol düzeyi yüksek olan hastaların koroner arterlerinin, kolesterol düzeyi normal olan kişilere göre daha dar olduğu söylenebilir.