Maliye’de SPSS Uygulamaları Regresyon Analizi Maliye’de SPSS Uygulamaları Doç. Dr. Aykut Hamit Turan SAÜ İİBF/ Maliye Bölümü
Öğrenme Hedefleri Bu konuyu çalıştıktan sonra: Basit Doğrusal regresyon öğrenecek Regresyon Modeli kurma öğrenilecek Çoklu regresyon modeli öğrenilecek
İçindekiler Konunun Özeti Değerlendirme Soruları Basit Doğrusal Regresyon Basit Doğrusal Regresyon Modeli Çoklu Doğrusal Regresyon Modeli Konunun Özeti Değerlendirme Soruları
Basit Doğrusal Regresyon Analizi Basit Doğrusal regresyon öğrenecek Basit Doğrusal Regresyon Analizi Regresyon analizi bir bağımlı değişken ile bir bağımsız (basit regresyon) veya birden fazla bağımsız (çoklu regresyon) değişken arasındaki ilişkilerin matematiksel eşitlik ile açılanması sürecidir Regresyon analizinde değişkenler arasındaki ilişki doğrusal ise doğrusal regresyon, değil ise doğrusal olmayan regresyon olarak adlandırılır.
Regresyon Modeli Y = β0 + β1x + e Regresyon Modeli kurma öğrenilecek Regresyon Modeli Y = β0 + β1x + e β0 = Doğrunun y eksenini kestiği nokta β1 = Doğrunun eğimi e = şansa bağlı hata terimi Burada β0 ve β1 hesaplanan ana kütlenin parametreleridir. Pratikte β0 ve β1 değerleri bilinmiyorsa, ana kütleden bir örnek alınarak ana kütle parametreleri hakkında istenilen bilgiler üretilir. Bu noktada tahmini değerler olarak b0 ve b1 kullanılır Aşağıdaki formüller ile b0 ve b1 hesaplanabilir b1 = (𝑥𝑖− 𝑥 )(𝑦𝑖− 𝑦) ∑(𝑥𝑖− 𝑥) b0 = 𝑦 – b1 𝑥
Regresyon Modeli kurma öğrenilecek Regresyon denklemi kullanılarak, verilen bir x değeri için y’nin tahmini değeri bulunabilir Basit regresyon analizine geçmeden önce değişkenler arasındaki normal dağılım ve doğrusal ilişki varsayımlarının test edilmesi gerekir Değişkenler arasındaki ilişkinin doğrusal olup, olmadığı serpilme grafiği Scatter Plot ile test edilebilir Graphs menüsünden legacy dialogs ve Scatter Plot seçilir. Y axis kısmına bağımlı değişken, X axis kısmına bağımsız değişken yerleştirilir ve Ok tuşuna basılır ve doğrusal ilişkinin varlığı veya yokluğu gözlemlenir. Normal dağılım için Analyze menüsünde Descriptives ve Explore seçenekleri seçilir. Burada Normality Tests with Plots seçeneği seçilir ve Normallik testleri Komolgov Smirnov veya Shapiro Wilkes’e bakılır
Regresyon Modeli kurma öğrenilecek Basit doğrusal regresyon analizini SPSS’te yapmak için Analyze > regression > Linear şeçenekleri seçilir. Bağımlı ve bağımsız değişken serileri tanımlandıktan sonra istenilen regresyon metotu seçilir ve Ok tuşuna basılarak sonuçlar elde edilir R2 bağımsız değişkenin, bağımlı değişkendeki değişimin ne kadarlık kısmını açıkladığını gösteren bir veridir. Yüksek olması istenir Regresyonun önemli varsayımlarından bir bağımsız ve bağımlı değişkenler arasında korelasyon olmamasıdır. Ayrıca hata terimleri arasında da korelasyon olmamasıdır SPSS korelasyon problemleri için basit bir ölçüt geliştirmiştir. Durbin Watson istatistiği hata terimleri arasında korelasyon olup, olmadığına bakmaktadır. Bu istatistik 0 ile 4 arasında yer alır. Eğer istatistik değeri 2 civarında ise, korelasyon olmadığı şeklinde yorumlanır. 0’a yakın değerler yüksek pozitif korelasyonu, 4’e yakın değerler yüksek negatif korelasyonu belirtir.
Çoklu Doğrusal Regresyon Çoklu Doğrusal Regresyon Öğrenilecek Çoklu Doğrusal Regresyon Basit doğrusal regresyon modeli birçok durum için elverişli olabilir ancak gerçek hayatta birçok modelin açıklanması için iki veya daha fazla açıklayıcı (bağımsız) değişkene ihtiyaç duyulacaktır y = β0 + β1x + e Basit doğrusal regresyon modeli y = β0 + β1x1 + ….. + βnxn + e Çoklu doğrusal regresyon modeli y = Bağımlı değişken xi = Bağımsız değişkenler βi = Tahmin edilecek parametreler e = Hata terimi Çoklu regresyon modelinde H0 hipotezi tüm regresyon katsayılarının sıfıra eşit olduğunu (H0 = β1 = β2 = β3 = …. = βn) şeklinde kurulurken Ha hipotezi en az bir βi’nin sıfırdan farklı olduğu şeklinde kurulur
Çoklu Doğrusal Regresyon Çoklu Doğrusal Regresyon Öğrenilecek Çoklu Doğrusal Regresyon Belirlilik katsayısı (R2) bağımlı değişkenin yüzde kaçının modele dahil edilen bağımsız değişkenler tarafından açıklandığını gösterir. Çoklu regresyonda modeler dahil edilen değişken sayısı arttıkça otomatik olarak R2 artar. Dolayısıyla çoklu regresyonda adjusted R2 değerini kullanmamız daha doğru olur Değişken seçiminde en fazla kullanılan metot enter metodudur. Enter metotunda araştırmacı modeli oluşturan bağımsız değişkenleri belirtir. Ardından bu modelin bağımlı değişkenleri tahmin etme başarısı değerlendirilir. Değişken ekleme metodunda (Forward Selection), SPSS değişkenleri bağımlı değişkenler olan korelasyonlarının güçlerine göre modele sırayla sokar. Modele giren her bir değişkenin etkisi ölçülür ve modeli önemli derecede etkilemeyen değişkenler modelden çıkarılır. Değişken eleme işlemi (Backward Selection), SPSS tüm değişkenleri modele dahil eder. En güçsüz bağımsız değişken modelden çıkarılır ve regresyon tekrar hesaplanır.
Çoklu Doğrusal Regresyon Çoklu Doğrusal Regresyon Öğrenilecek Çoklu Doğrusal Regresyon Değişken ekleme ve eleme metodu (Stepwise Selection) ise her değişken modele sırayla eklenir ve model değerlendirilir. Eğer eklenen değişken modele katkı sağlıyorsa modelde bu değişken kalır. Veriler SPSS’e girildikten sonra Analyze > Regression > Linear seçenekleri ile doğrusal regresyon menüsü açılır Dependent bağımlı, independent bağımsız değişkenin yer alacağı kutucuktur Statistics sekmesinden Durbin Watson istatistiği seçilir ANOVA testi regresyon modelinin bir bütün olarak anlamlı olup, olmadığını gösteren bir istatistiktir