ÇOKLU DOĞRUSAL BAĞLANTI
ÇOKLU DOĞRUSALLIĞIN ANLAMI Çoklu doğrusal bağlantı; Bağımsız değişkenler arasında doğrusal (yada doğrusala yakın) ilişki olmasıdır. 1. parametreler belirlenemez hale gelir. Her bir parametre için ayrı ayrı sayısal değerler bulmak zorlaşır . 2. ise bu değişkenlere ortogonal değişkenler denir ve katsayıların tahmininde çoklu doğrusal bağlantı açısından hiçbir sorun yoktur. 3. ise tam çoklu doğrusal bağlantı yoktur.
ÇOKLU DOĞRUSAL BAĞLANTI X3 X2 rX2X3= 1 Tam Çoklu Doğrusal Bağlantı
ÇOKLU DOĞRUSALLIĞIN NEDENLERİ İktisadi değişkenlerin zaman içerisinde birlikte değişme eğiliminde olmaları Bazı açıklayıcı değişkenlerin gecikmeli değerlerinin ilişkide ayrı birer etmen olarak kullanılmasıdır. Genellikle zaman ve kesit serilerinde görülür.
Çoklu Doğrusal Bağlantının Ortaya Çıkardığı Sonuçlar Regresyon katsayılarının değerleri belirsiz olur, Regresyon katsayılarının varyansları büyür, t-istatistikleri azalır, Güven aralıkları büyür, r2 olduğundan büyük çıkar, Katsayı tahmincileri ve standart hataları verilerdeki küçük değişmelerden önemli ölçüde etkilenirler,
ÇOKLU DOĞRUSAL BAĞLANTININ VARLIĞININ BELİRLENMESİ Çoklu doğrusal bağlantı stokastik olmadığı kabul edilen bağımsız değişkenler arasında ilişki olmaması durumunu gösterir. Anakütle ile ilgili değil örnek ile ilgili bir özelliktir. Bu nedenle çoklu doğrusal bağlantı test edilemez. Ancak belli bir örnekten hareketle derecesi ölçülebilmektedir. Çoklu doğrusallığın belirlenmesinde bir çok yöntem vardır.
ÇOKLU DOĞRUSAL BAĞLANTININ ORTAYA ÇIKARDIĞI SONUÇLAR a) Katsayıları tahminleri belirlenemez. b)Tahminlerin standart hataları sonsuz büyük olur.
İspat a)
İspat b) X2 yerine kX1 konursa
1. Çoklu doğrusallığın en önemli belirtisi bir modelde yüksek R2 olması ve ancak regresyon katsayılarının t istatistiklerinin anlamsız olmasıdır. F istatistiğinin çoğu durumda anlamlı olmasıdır. (Regresyon katsayılarının varyansları büyür t istatistikleri küçülür) 2. Bağımsız değişkenler arasında ikişerli kuvvetli ilişki bulunması da çoklu doğrusal bağlantı bulunması belirtilerindendir. Örneğin iki bağımsız değişken arasındaki korelasyon katsayısı 0.80 ve üstü ise çoklu doğrusal bağlantı önemli problem gösterir. Bazen bağımsız değişkenler arasında ikişerli zayıf ilişki olması durumunda da çoklu doğrusal bağlantı problemi olabilir.
İkiden fazla bağımsız değişken olması durumunda kısmi korelasyon katsayıları kriterine de bakılmaktadır. Örneğin Y ile X1, X2, X3 ve X4 arasındaki regresyonda R değeri yüksekken r12.34 r13.24 r14.23 kısmi korelasyon katsayıları değerleri düşükse X2, X3 ve X4 arasında ikişerli kuvvetli çoklu doğrusal bağlantı olduğu sonucuna varılabilir. X lerden biri modelden çıkarılabilir. R değeri yüksek ve kısmi korelasyon katsayıları da yüksekse çoklu doğrusal bağlantı olduğuna karar veremeyiz.
ÇOKLU DOĞRUSAL BAĞLANTININ VARLIĞININ BELİRLENMESİ 1.Varyans Büyütme Modeli: Varyans büyütme faktörü; parametre tahminlerinin ve varyanslarının çoklu doğrusal bağlantı nedeni ile gerçek değerlerinden ne derece uzaklaştığını gösterir. VIF kriteri
Çoklu doğrusal bağlantı önemlidir. Çoklu doğrusal bağlantı etkisini araştırabilmek için k tane VIF değeri bulunur. Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir. 5 Çoklu doğrusal bağlantı önemlidir. .
Çoklu doğrusal bağlantı önemlisizdir. Çoklu doğrusal bağlantı etkisini araştırabilmek için k tane VIF değeri bulunur. Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir. 5 Çoklu doğrusal bağlantı önemlisizdir. .
ÖRNEK: 1990-2002 dönemi için Türkiye’nin GSMH(milyar TL), Para Arzı(PA, milyar TL), Dış Ticaret Açığı (DT, milyar TL) ve Toptan Eşya Fiyat Endeksi (TEFE,1987=100) değerleri verilmiştir. Yıllar GSMH PA DT TEFE 1990 0.397178 0.072425 -0.0244 425.6 1991 0.634393 0.117118 -0.03118 661.6 1992 1.103605 0.190736 -0.05618 1072.5 1993 1.997323 0.282442 -0.15573 1701.6 1994 3.887903 0.630348 -0.15414 3757.4 1995 7.854887 1.256632 -0.64664 7065.2 1996 14.97807 2.924893 -1.66881 12335.4 1997 29.39326 5.6588 -3.40719 22366.1 1998 53.51833 11.4232 -4.96864 38067.2 1999 78.28297 22.40182 -5.94562 58599.1 2000 125.5961 31.9121 -16.7507 89239.7 2001 179.4801 47.24108 -12.3931 144862.2 2002 265.4756 61.87976 -23.4451 216711.5 Varyans büyütme faktörü ile çoklu doğrusal bağlantı sorununu araştırınız.
Bu verilerden elde edilen model; Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir. 5 çoklu doğrusal bağlılık önemlidir 5 çoklu doğrusal bağlılık önemlidir 5 çoklu doğrusal bağlılık önemlidir
2.Yardımcı Regresyon Modelleri için F testi Modelde yer alan her bir bağımsız değişken ayrı ayrı bağımlı değişken olmak üzere kalan diğer bağımsız değişkenlerle regresyona tabi tutulur. Oluşturulan söz konusu yeni regresyon modellerine yardımcı regresyon modelleri denir. Oluşturulan yardımcı regresyon modellerinin belirlilik katsayıları hesaplanarak F test istatistiği hesaplanır. Bu yöntem için temel hipotez bağımsız değişkenler arasında ilişki yoktur şeklindedir.
. R2 R2 R2 Test istatistiği yukarıdaki her denklem için hesaplanır. k: Esas modelin tahmin edilen katsayı sayısı
ÖRNEK: 1990-2002 dönemi için Türkiye’nin GSMH(milyar TL), Para Arzı(PA, milyar TL), Dış Ticaret Açığı (DT, milyar TL) ve Toptan Eşya Fiyat Endeksi (TEFE,1987=100) değerleri verilmiştir. Yıllar GSMH PA DT TEFE 1990 0.397178 0.072425 -0.0244 425.6 1991 0.634393 0.117118 -0.03118 661.6 1992 1.103605 0.190736 -0.05618 1072.5 1993 1.997323 0.282442 -0.15573 1701.6 1994 3.887903 0.630348 -0.15414 3757.4 1995 7.854887 1.256632 -0.64664 7065.2 1996 14.97807 2.924893 -1.66881 12335.4 1997 29.39326 5.6588 -3.40719 22366.1 1998 53.51833 11.4232 -4.96864 38067.2 1999 78.28297 22.40182 -5.94562 58599.1 2000 125.5961 31.9121 -16.7507 89239.7 2001 179.4801 47.24108 -12.3931 144862.2 2002 265.4756 61.87976 -23.4451 216711.5 Yardımcı regresyon kriteri ile çoklu doğrusal bağlantı sorununu araştırınız. 19
Bu verilerden elde edilen model; Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir. 20
H0: Çoklu doğrusal bağlantı yoktur. 1.Aşama: H1: Çoklu doğrusal bağlantı vardır. 2.Aşama: F0.05,(k-2),(n-k+1) =4.10 3.Aşama: 4.Aşama: Fhes > Ftab H0 reddedilir.
Fhes > Ftab H0 reddedilir.
ÇOKLU DOĞRUSAL BAĞLANTININ BELİRLENMESİ 2.Yardımcı Regresyon Modelleri için F testi Dependent Variable: HOUSING Method: Least Squares Sample: 1963 1985 Included observations: 23 Variable Coefficient Std. Error t-Statistic Prob. C 5087.434 11045.79 0.460577 0.6506 GNP 1.756353 2.139984 0.820732 0.4225 INTRATE -174.6918 61.00066 -2.863769 0.0103 POP -33.43369 83.07564 -0.402449 0.6921 UNEMP 79.71988 122.5794 0.650353 0.5237 R-squared 0.449950 Mean dependent var 1601.100 Adjusted R-squared 0.327716 S.D. dependent var 345.4715 S.E. of regression 283.2621 Akaike info criterion14.32028 Sum squared resid 1444274. Schwarz criterion 14.56713 Log likelihood -159.6833 F-statistic 3.681069 Durbin-Watson stat 0.793569 Prob(F-statistic) 0.023274 23
F0.05,(3),(19) =3.13 1.Aşama: H0: Çoklu doğrusal bağlantı yoktur. H1: Çoklu doğrusal bağlantı vardır. 2.Aşama: F0.05,(3),(19) =3.13 3.Aşama: 4.Aşama: Fhes > Ftab H0 reddedilir. 24
F0.05,(3),(19) =3.13 1.Aşama: H0: Çoklu doğrusal bağlantı yoktur. H1: Çoklu doğrusal bağlantı vardır. F0.05,(3),(19) =3.13 2.Aşama: 3.Aşama: 4.Aşama: Fhes > Ftab H0 reddedilir. 25
F0.05,(3),(19) =3.13 1.Aşama: H0: Çoklu doğrusal bağlantı yoktur. H1: Çoklu doğrusal bağlantı vardır. F0.05,(3),(19) =3.13 2.Aşama: 3.Aşama: 4.Aşama: Fhes > Ftab H0 reddedilir. 26
F0.05,(3),(19) =3.13 1.Aşama: H0: Çoklu doğrusal bağlantı yoktur. H1: Çoklu doğrusal bağlantı vardır. 2.Aşama: F0.05,(3),(19) =3.13 3.Aşama: 4.Aşama: Fhes > Ftab H0 reddedilir. 27
ÇOKLU DOĞRUSAL BAĞLANTI PROBLEMİNİ ORTADAN KALDIRMA YOLLARI 1.Ön Bilgi Yöntemi Y = b1 + b2 X2 + b3 X3 +b4 X4+ u b3 = 0.2b2 Y = b1 + b2 X2 + 0.2b2 X3 +b4 X4+ u Y = b1 + b2 (X2 + 0.2 X3 )+b4 X4+ u Y = b1 + b2 X*+ b4 X4+ u Yukarıdaki hesaplama bağımsız değişkenler arasında çoklu doğrusal bağlantıdan etkilenmemektedir. Katsayılara sınır koyarak iki değişken arasında çoklu doğrusal bağlantı problemi ortadan kaldırılmış oluyor.
2.Kesit ve Zaman Serilerinin Birleştirilmesi Y:Talep P:Malın fiyatı I:Tüketici geliri t:Yıl lnY = b1 + b2 lnPt+ b3 lnIt + u b2 ve b3 fiyat ve gelir elastikiyetidir. Zaman serisi P ve I (fiyat ve gelir) değişkenleri arasında genellikle yüksek dereceli ilişki vardır. Çoklu doğrusal bağlantı var. b3 gelir elastikiyeti (eğer varsa) anket verilerinden ayrıca tahmin edilir.
lnY - b3 lnIt = b1 + b2 lnPt+ u lnY* = b1 + b2 lnPt + u Yukarıdaki regresyon modelinden aşağıdaki gibi yararlanırız: lnY - b3 lnIt = b1 + b2 lnPt+ u lnY* = b1 + b2 lnPt + u Burada Gelir değişkeninin etkisi giderildikten sonraki Y değeridir. Bu yöntemde katsayı tahminlerinin yorumu sorundur. Zaman serisi verisi ve kesit serisi verisindeki gelir elastikiyetinin aynı olduğunu kabul ediyoruz.
3.Bazı Değişkenlerin Modelden Çıkarılması Modelden bir bağımsız değişken çıkarılırsa spesifikasyon hatası yapma olasılığı artar: Katsayı tahminleri gerçek değerinin üstünde veya altında tahmin edilebilir. 4.Değişkenleri Dönüştürme Yöntemi, Fark denklemi yaratılır:
5.Ek veya Yeni Örnek Verisi Temin Etme, Dönüşümlü modelde çoklu doğrusal bağlantı önemli ölçüde azalmış olur. 5.Ek veya Yeni Örnek Verisi Temin Etme, 6.Diğer Yöntemler
Çoklu Doğrusal Bağlantı-Örnek- Otomobil Bakım Harcamaları Model Tahminleri Değişkenler Model A Model B Model C Sabit -626.24 (-5.98) 7.29 (0.06) -796.07 (-5.91) Yas 27.58 (9.58) 7.35 (22.16) Km 53.45 (18.27) -151.15 (-7.06) 55 55 54 s.d. Düzeltilmiş-R2 0.897 0.856 0.946
Ev Talebi Model Tahminleri Değişkenler Model A Model B Model C s.d. Sabit Faiz Nüfus GSMH Düzeltilmiş-R2 0.375 20 687.90 (1.80) -169.66 (-3.87) 0.91 (3.64) 0.348 19 14.90 (0.41) -184.75 (-3.18) -1315.75 (-0.27) 0.52 (0.54) 20 0.371 -3812.93 (-2.40) -198.40 (-3.87) 33.82 (3.61) r(Nüfus,faiz)= 0.91 r(GSMH,Nüfus)=0.99 r(GSMH,faiz)=0.88