Lineer Regresyon
Amaç: Bu konu sonunda Tıp Fakültesi 1. sınıf öğrencilerinin çeşitli bağımsız değişkenleri kullanarak bir nümerik değişkenin değerini tahmin etmek için lineer regresyon analizi hakkında bilgi sahibi olması ve bu analiz SPSS ile yapabilmesi amaçlanmıştır. Hedefler: Bu konu sonunda Tıp Fakültesi 1. sınıf öğrencilerinin aşağıdaki hedeflere ulaşması beklenmektedir: Lineer regresyon analizinin endikasyonlarını açıklayabilmek Lineer regresyon analizinin varsayımlarını sayabilmek Lineer regresyon modeline konacak değişkenlerin nasıl seçileceğini açıklayabilmek “Dummy değişken” terimini açıklayabilmek SPSS’te Lineer regresyon analizi yapabilmek SPSS’te Lineer regresyon çıktısını yorumlayabilmek / 14 2
Kişilerin vücut ağırlıklarını bazı bağımsız değişkenleri kullanarak tahmin etmek istiyoruz. Araştırmamızda kişilerin yaşları, boyları, cinsiyetleri gibi değişkenler hakkında veri toplanmış. Bağımsız değişkenlerden faydalanarak kişilerin vücut ağırlıklarını tahmin edebilir miyiz? / 14 3
Regresyon analizleri sağlık hizmetlerinde sıklıkla kullanılmaktadır. Tahmin etmek istediğimiz değişkenin nümerik olması durumunda Lineer (İng.=doğrusal) regresyon (İng.=gerileme) analizi yapmalıyız. Örneğimizde vücut ağırlığını (nümerik değişken) tahmin etmek istiyoruz. Tahmin ettirici (bağımsız) değişkenlerin de nümerik olması gerekir. Regresyon analizi, iki ya da daha çok değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. / 14 4
Varsayımlar Lineer ilişki: Lineer ilişki :saçılma grafiği veya korelasyon analizi Hatalar normal dağılım göstermelidir : Multi kolinearite olmamalı: Örneğin, tansiyonu tahmin etmek için kan şekeri ve hemoglobin A1c değişkenlerin kullanımı Otokorelasyon olmamalı: Bağımlı değişkenin bir ölçümü ötekileri etkilememeli. Örneğin bir firmanın borsadaki değeri bağımlı değişken olsa, firmanın önceki fiyatı sonraki değerini etkiler. Otokorelasyon da saçılma grafiği veya Durbin-Watson (d) testi ile incelenebilir Gözlemler bağımsız olmalıdır Bağımsız değişken hatasız ölçülebilmelidir Varsayımlar sağlanamazsa? Veri dönüştürme Lineer ilişki ve gözlemlerin bağımsızlığı en önemlileri Hipotez testlerindeki p değeri, standart hata etkilenebilir / 14 5
Modelin oluşturulması İyi bir regresyon analizi için öncelikle sağlam bir model oluşturmalıyız. Yani, tahmin etmeye çalıştığımız bağımlı değişkenimiz etki edebilecek faktörleri iyi belirlemeliyiz. Bu işlemi klinik bilgimizi ve literatür verilerini kullanarak yapmalıyız. Örn. diyabetik bireylerin sigara içme durumlarının tahmininde kullanacağımız modele yaş ve cinsiyeti eklemeliyiz. Çünkü, mevcut bilgilerimiz, bu değişkenlerin her ikisinin de sigara içiciliğini belirlemede önemli olduğunu gösteriyor. Diyabetin süresinin ve medeni durumun da sigara içiciliği üzerinde etkili olabileceğini varsayabiliriz. Modelimize çok fazla değişken koymak yerine az değişkenle daha kesin bir tahmin yapmayı tercih etmeliyiz. Diğer taraftan, örneklem sayımızın yeterli olmadığı durumlarda çok sayıda değişkeni modelimize eklememiz halinde analiz yapılamayacaktır. / 14 6
SPSS ile uygulama 1.Sıfır hipotezi (H 0 ) ve alternatif hipotezin (H 1 ) tanımlanması: H 0 : Oluşturulan modeldeki değişkenlerin kişilerin ağırlıklarını tahmin etmede etkisi yoktur. H 1 : Oluşturulan modeldeki değişkenler kişilerin ağırlıklarını tahmin ettirebilir. 2.Verilerin toplanması: Veriler diyabet.sav verisetinde kaydedildi. Bağımlı değişkenimiz “weight” nümerik olarak kodlanmıştır. Bağımsız değişkenler olarak incelenecek “age_year” ve “height” değişkenleri de nümeriktir. Korelasyon analizinde ağırlık ile yaş ve boy arasında anlamlı bir korelasyon olduğu ama yaş ile boy arasında (bağımsız değişkenler) korelasyon olmadığı görülmektedir: / 14 7
Saçılma grafiklerinde de ilişkinin – zayıf da olsa – lineer olduğu görülmektedir: / 14 8
3. İlgili sıfır hipotezi için test istatistiğinin hesaplanması: Analyze>Regression>Linear> [“weight” değişkenini “Dependent” alanına, “age_year” ve “height” değişkenlerini “Independent(s)” alanına geçirelim.]> Statistics>[Confidence intervals ve Durbin-Watson kutucuklarını işaretleyelim]> Continue>Save>[Unstandardized kutucuğunu işaretleyelim. Böylece modelimizin tahmin değerleri veri setimizde ayrı bir sütun olarak hesaplanıp yazılacaktır.]Continue>OK / 14 9
R kare değeri 16,3 olarak hesaplanmıştır. Bu durumda “Modelimizin ağırlığa etki eden faktörlerin %16,3’ünü açıklayabildiğini” söyleyebiliriz. Durbin-Watson değerinin 1,9 olması ilgili varsayımın karşılandığını göstermektedir. / 14 10
4. Test istatistiğinden elde edilen değerin bilinen bir olasılık dağılımı ile karşılaştırılması: F dağılımı kullanılarak yapılan çıkarımda ANOVA tablosunda p değerinin <0,001 olduğu görülmektedir. Bu durumda modelimizin bütüm olarak bakıldığında anlamlı olduğunu söyleyebiliriz. 5. P değerinin ve sonuçların yorumlanması Bu tabloda hem yaş (p=0,002), hem de boy (p<0,001) değişkeninin birbirinden bağımsız olarak ağırlığa etki ettikleri söylenebilir. Bu bilgiler kullanılarak bir lineer regresyon eşitliği yazılabilir. / 14 11
Lineer regresyon eşitliği / 14 12
Kategorik değişkenlerin modele konulması Daha önce bahsedildiği üzere, lineer regresyon analizinde modelimize sadece nümerik değişkenleri dahil edebiliriz. Bununla birlikte, kategorik değişkenlerin modele eklenme zorunluluğu hissedildiğinde değişkenler ikili olarak kodlanmak suretiyle modele eklenebilirler. Oluşturulan bu yeni değişkenlere Dummy değişken denir. Örneğin, ağırlığı tahmin etmede cinsiyet değişkenini de modele eklemek istesek cinsiyeti erkek=1; kadın=2 yerine erkek (1=evet; 0=hayır), kadın (1=evet; 0=hayır) şeklinde kodlamamız gerekir. Yeniden kodlamayı şu şekilde yapabiliriz: Transform>Recode into Different Variables / 14 13
Özet Lineer regresyon analizinin endikasyonları Lineer regresyon analizinin varsayımları Lineer regresyon modeline konacak değişkenlerin nasıl seçilir? “Dummy değişken” SPSS’te Lineer regresyon analizi SPSS’te Lineer regresyon çıktısı14 / 14 14