Hatalarda Normal Dağılım EKK tahmincilerinin ihtimal dağılımları ui’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır. b tahminleri için uygulanan testlerin geçerliliği ui’nin normal dağılmasına bağlıdır. Çünkü ui normal dağılıyorsa, EKK b1 ve b2’nin tahmincileri de normal dağılır. Normal dağılmış değişkenleri olan bir doğrusal fonksiyonun kendisi de NORMAL DAĞILIR.
- + E(ui)=0 ui değerleri
Jarque-Bera Normallik Testi 1.Aşama H0: ui’ler normal dağılımlıdır H1: ui’ler normal dağılımlı değildir c2a,sd =? 2.Aşama Sd=? a = ? 3.Aşama JB > c2a,sd 4.Aşama H0 hipotezi reddedilebilir
Jarque-Bera Normallik Testi
Jarque-Bera Normallik Testi 7.0545 4.7091 -3.6364 11.0182-14.327-17.6727 4.9818 -3.3636 -7.7091 18.9455 49.77 22.18 13.22 121.40 205.27 312.32 24.82 11.31 59.43 358.93 351.0 104.43 -48.09 1337.62 -2940.99 -5519.61 123.6 -38.06 -458.15 6800.15 2476.65 491.76 174.86 14738.14 42136.40 97546.48 615.95 128.00 3531.95 128832.16 Se = 0 Se2 = 1178.66 Se3 = -287.99 Se4 = 290672.35
Jarque-Bera Normallik Testi =117.866 = s2 =-28.799 =29067.235 =-0.023 = 2.09
Jarque-Bera Normallik Testi 1.Aşama H0: ui’ler normal dağılımlıdır H1: ui’ler normal dağılımlı değildir 2.Aşama a = 0.05 Sd=2 c2a,sd =5.991 3.Aşama 0.3459 4.Aşama JB < c2a,sd H0 hipotezi reddedilemez.
NORMAL DAĞILIM UYGULAMASI On ülkede günlük gazete satış adedi (Y), nüfus (X2) ve gayrisafi milli hasıla (X3) verilerden elde edilen doğrusal modelin hata terimlerinin normal dağılıp dağılmadığını test etmek için: i) H0: Hatalar normal dağılıma sahiptir H1: Hatalar normal dağılıma sahip değildir. ii) JB test istatistiği hesaplanır:
iv) JB =19 > 5.99 H0 red Hatalar normal dağılıma sahip değildir.
Eviews ile normal dağılımı test edilirse iv) JB =19.06 > 5.99 ya da prob= 0.000< 0.05 H0 red Hatalar normal dağılıma sahip değildir.
ÇOKLU DOĞRUSAL BAĞLANTI
ÇOKLU DOĞRUSALLIĞIN ANLAMI Çoklu doğrusal bağlantı; bağımsız değişkenler arasında doğrusal (yada doğrusala yakın) ilişki olmasıdır. 1. Parametreler belirlenemez hale gelir. Her bir parametre için ayrı ayrı sayısal değerler bulmak zorlaşır. 2. Bu değişkenlere ortogonal değişkenler denir ve katsayıların tahmininde çoklu doğrusal bağlantı açısından hiçbir sorun yoktur. 3. Tam çoklu doğrusal bağlantı yoktur.
TAM ÇOKLU DOĞRUSAL BAĞLANTI X3 X2 rX2X3= 1 Tam Çoklu Doğrusal Bağlantı
ÇOKLU DOĞRUSALLIĞIN NEDENLERİ İktisadi değişkenlerin zaman içerisinde birlikte değişme eğiliminde olmaları Bazı açıklayıcı değişkenlerin gecikmeli değerlerinin ilişkide ayrı birer etmen olarak kullanılmasıdır. Zaman ve kesit serilerinde de görülür.
ÇOKLU DOĞRUSAL BAĞLANTININ ORTAYA ÇIKARDIĞI SONUÇLAR Regresyon katsayılarının değerleri belirsiz olur, Regresyon katsayılarının varyansları büyür, t-istatistikleri azalır, Güven aralıkları büyür, r2 olduğundan büyük çıkar, Katsayı tahmincileri ve standart hataları verilerdeki küçük değişmelerden önemli ölçüde etkilenirler,
ÇOKLU DOĞRUSAL BAĞLANTININ ORTAYA ÇIKARDIĞI SONUÇLAR a) Katsayıları tahminleri belirlenemez. b)Tahminlerin standart hataları sonsuz büyük olur.
İspat a)
İspat b) X2 yerine kX1 konursa
ÇOKLU DOĞRUSAL BAĞLANTININ VARLIĞININ BELİRLENMESİ Varyans Büyütme Modeli Yardımcı Regresyon Modelleri için F testi Klein – Kriteri Şartlı Sayı Kriteri Theil-m Ölçüsü
ÇOKLU DOĞRUSAL BAĞLANTININ VARLIĞININ BELİRLENMESİ 1.Varyans Büyütme Modeli: Varyans büyütme faktörü; parametre tahminlerinin ve varyanslarının çoklu doğrusal bağlantı nedeni ile gerçek değerlerinden ne derece uzaklaştığını gösterir. VIF kriteri
Çoklu doğrusal bağlantı önemlidir. Çoklu doğrusal bağlantı etkisini araştırabilmek için k tane VIF değeri bulunur. Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir. 5 Çoklu doğrusal bağlantı önemlidir. .
Çoklu doğrusal bağlantı önemlisizdir. Çoklu doğrusal bağlantı etkisini araştırabilmek için k tane VIF değeri bulunur. Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir. 5 Çoklu doğrusal bağlantı önemlisizdir. .
ÖRNEK: 1990-2002 dönemi için Türkiye’nin GSMH(milyar TL), Para Arzı(PA, milyar TL), Dış Ticaret Açığı (DT, milyar TL) ve Toptan Eşya Fiyat Endeksi (TEFE,1987=100) değerleri verilmiştir. Yıllar GSMH PA DT TEFE 1990 0.397178 0.072425 -0.0244 425.6 1991 0.634393 0.117118 -0.03118 661.6 1992 1.103605 0.190736 -0.05618 1072.5 1993 1.997323 0.282442 -0.15573 1701.6 1994 3.887903 0.630348 -0.15414 3757.4 1995 7.854887 1.256632 -0.64664 7065.2 1996 14.97807 2.924893 -1.66881 12335.4 1997 29.39326 5.6588 -3.40719 22366.1 1998 53.51833 11.4232 -4.96864 38067.2 1999 78.28297 22.40182 -5.94562 58599.1 2000 125.5961 31.9121 -16.7507 89239.7 2001 179.4801 47.24108 -12.3931 144862.2 2002 265.4756 61.87976 -23.4451 216711.5 Varyans büyütme faktörü ile çoklu doğrusal bağlantı sorununu araştırınız.
Bu verilerden elde edilen model; Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir. 5 çoklu doğrusal bağlılık önemlidir 5 çoklu doğrusal bağlılık önemlidir 5 çoklu doğrusal bağlılık önemlidir
2.Yardımcı Regresyon Modelleri için F testi Bu yöntemde varyans büyütme faktöründe hesaplanan belirlilik katsayılarından hesaplama yapılır. Sırası ile incelenen modelde yer alan her bir bağımsız değişken ayrı ayrı bağımlı değişken olmak üzere kalan diğer bağımsız değişkenlerle regresyona tabi tutulur. Oluşturulan söz konusu yeni regresyon modellerine yardımcı regresyon modelleri denir. Oluşturulan yardımcı regresyon modellerinin belirlilik katsayıları hesaplanarak F test istatistiği hesaplanır. Bu yöntem için temel hipotez bağımsız değişkenler arasında ilişki yoktur şeklindedir.
. Test istatistiği yukarıdaki her denklem için hesaplanır. k: ana modelin tahmin edilen katsayı sayısı
H0: Çoklu doğrusal bağlantı yoktur. UYGULAMA: Aynı örnek için yardımcı regresyon modeli ile çoklu doğrusal bağlantı sorununu inceleyiniz. H0: Çoklu doğrusal bağlantı yoktur. 1.Aşama: H1: Çoklu doğrusal bağlantı vardır. 2.Aşama: F0.05,(k-2),(n-k+1) =4.10 3.Aşama: Fhes > Ftab H0 reddedilir. 4.Aşama:
Fhes > Ftab H0 reddedilir.
Çoklu doğrusal bağlılık zararlıdır. 3.Klein – Kriteri: Klein, bağımsız değişkenler arasındaki basit korelasyon katsayılarının kareleri modelin genel belirlilik katsayısından büyük olmadığı sürece çoklu doğrusallığın zararlı olmadığını savunmaktadır. Çoklu doğrusal bağlılık zararlıdır. Klein’in yukarıdaki kriterine göre küçük bir çoklu doğrusal bağlantı bile parametre tahminlerinde anlamsızlığa yol açabilir.
Bu durumda yardımcı regresyon modelleri için F testinde açıklandığı gibi, yardımcı regresyon modelleri tahmin edilir ve bunlardan elde edilecek çoklu belirlilik katsayısı ile karşılaştırılarak karar verilebilir.
UYGULAMA: Aynı örnek için Klein kriteri ile çoklu doğrusal bağlantı sorununu inceleyiniz. Elde edilen yardımcı regresyon modelleri 1. Çoklu doğrusal bağlantı zararlı değildir. 2. Çoklu doğrusal bağlantı zararlı değildir. 3. Çoklu doğrusal bağlantı zararlı değildir.
4.Şartlı Sayı Kriteri: Bu kriterin hesaplanması için bu (X’X) matrisinin birim köklerinden (özdeğerlerinden) yararlanılır. (X’X) matrisinin en büyük birim kökü (1) ve en küçük birim kökü (2) ise şartlı sayı KARAR: Çoklu doğrusal bağlantı orta derecedir. 1. Çoklu doğrusal bağlantı yüksek derecedir. 2.
Örnek: 12 ailenin aylık gıda harcamaları (Y), toplam harcamaları (X2) ve fert sayısı (X3) verileri aşağıdaki gibidir: Aile Y X2 X3 1 2.2 2.8 3 2 3,0 3.5 6 4.1 12.5 4 4.7 6.4 5 4.2 5.9 6.3 8,0 8 7 4.6 9.7 8.8 20.6 9 7.3 15.9 10 4.4 6.7 11 6.9 11.3 12
Ortalamadan farklar ile bağımsız değişkenler katsayı matrisi;
KARAR: Çoklu doğrusal bağlantı düşük derecededir.
5.Theil-m Ölçüsü Bağımlı değişkenle bağımsız değişkenler arasındaki ilişkiye dayanan bir ölçüdür. Bu ölçü için, modelin genel belirlilik katsayısı ile modelden sırası ile bir tane bağımsız değişkenin çıkarılması ile elde edilecek modellerin çoklu belirlilik katsayıları kullanılır. Modelde yer alan tüm bağımsız değişkenler sırası ile modelden çıkarılarak Regresyon modelleri tahmin edilir ve her model için çoklu belirlilik katsayıları elde edilir.
Theil-m Ölçüsü hesaplanır. Burada bağımsız değişkenlerden biri çıkartıldıktan sonra bağımlı değişken ile diğer bağımsız değişkenlerin regresyonu sonucunda tahmin edilen çoklu belirlilik katsayısını ifade eder. Theil-m ölçüsü çoklu doğrusal bağlılığın önemli olup olmadığı hakkında bilgi vermediğinden, varyans büyütme faktörü ile şartlı sayı daha çok kullanılan ve daha yarar sağlayan kriterlerdir.
Theil-m Ölçüsü “m” ölçüsü her regresyon için ayrı ayrı hesaplanmayan genel bir ölçüdür. m ölçüsü negatif çıkabileceği gibi çok yüksek pozitif değer de olabilmektedir. Hesaplanan m ölçüsü sıfıra eşitse bağımsız değişkenler ilişkisizdir. m = 0 bağımsız değişkenler ilişkisizdir
Yardımcı regresyon modellerini oluşturalım: Örnek: Slayt 11 de incelediğimiz model için Theil-m ölçüsünü uygulayalım. Yardımcı regresyon modellerini oluşturalım: m sıfıra yakın bir değer değildir, çoklu doğrusal bağlılık söz konusudur.
ÇOKLU DOĞRUSAL BAĞLANTI PROBLEMİNİ ORTADAN KALDIRMA YOLLARI Ön bilgi yöntemi ile; 2. Kesit ve zaman serisi verilerinin birleştirme yöntemi ile; 3. Bazı değişkenlerin modelden çıkarılması yöntemi ile; 4. Değişkenleri dönüştürme yöntemi ile; 5. Ek veya yeni örnek verisi temini yöntemi ile 40
ÇOKLU DOĞRUSAL BAĞLANTI PROBLEMİNİ ORTADAN KALDIRMA YOLLARI 1.Ön Bilgi Yöntemi Y = b1 + b2 X2 + b3 X3 +b4 X4+ u b3 = 0.2b2 Y = b1 + b2 X2 + 0.2b2 X3 +b4 X4+ u Y = b1 + b2 (X2 + 0.2 X3 )+b4 X4+ u Y = b1 + b2 X*+ b4 X4+ u Yukarıdaki hesaplama bağımsız değişkenler arasında çoklu doğrusal bağlantıdan etkilenmemektedir. Katsayılara sınır koyarak iki değişken arasında çoklu doğrusal bağlantı problemi ortadan kaldırılmış oluyor.
2.Kesit ve Zaman Serilerinin Birleştirilmesi Y:Talep P:Malın fiyatı I:Tüketici geliri t:Yıl lnY = b1 + b2 lnPt+ b3 lnIt + u b2 ve b3 fiyat ve gelir elastikiyetidir. Zaman serisi P ve I (fiyat ve gelir) değişkenleri arasında genellikle yüksek dereceli ilişki vardır. Çoklu doğrusal bağlantı var. b3 gelir elastikiyeti (eğer varsa) anket verilerinden ayrıca tahmin edilir.
lnY - b3 lnIt = b1 + b2 lnPt+ u lnY* = b1 + b2 lnPt + u Yukarıdaki regresyon modelinden aşağıdaki gibi yararlanırız: lnY - b3 lnIt = b1 + b2 lnPt+ u lnY* = b1 + b2 lnPt + u Burada Gelir değişkeninin etkisi giderildikten sonraki Y değeridir. Bu yöntemde katsayı tahminlerinin yorumu sorundur. Zaman serisi verisi ve kesit serisi verisindeki gelir elastikiyetinin aynı olduğunu kabul ediyoruz.
3.Bazı Değişkenlerin Modelden Çıkarılması Modelden bir bağımsız değişken çıkarılırsa spesifikasyon hatası yapma olasılığı artar: Katsayı tahminleri gerçek değerinin üstünde veya altında tahmin edilebilir. 4.Değişkenleri Dönüştürme Yöntemi, Fark denklemi yaratılır:
5.Ek veya Yeni Örnek Verisi Temin Etme, Dönüşümlü modelde çoklu doğrusal bağlantı önemli ölçüde azalmış olur. 5.Ek veya Yeni Örnek Verisi Temin Etme, 6.Diğer Yöntemler
Örnek Konut Talebi Model Tahminleri Değişkenler Model A Model B Model C s.d. Sabit Faiz Nüfus GSMH Düzeltilmiş-R2 0.375 20 687.90 (1.80) -169.66 (-3.87) 0.91 (3.64) 0.348 19 14.90 (0.41) -184.75 (-3.18) -1315.75 (-0.27) 0.52 (0.54) 20 0.371 -3812.93 (-2.40) -198.40 (-3.87) 33.82 (3.61) r(GSMH,Nüfus)=0.99 r(GSMH,faiz)=0.88 r(Nüfus,faiz)= 0.91
Örnek Otomobil Bakım Harcamaları Model Tahminleri Değişkenler Model A Model B Model C Sabit -626.24 (-5.98) 7.29 (0.06) -796.07 (-5.91) Yas 27.58 (9.58) 7.35 (22.16) Km 53.45 (18.27) -151.15 (-7.06) 55 55 54 s.d. Düzeltilmiş-R2 0.897 0.856 0.946
ÖRNEK 11 ülkenin 1995 yılı ekonomik büyüme oranlarını , para arzındaki büyüme oranlarını sermaye stokundaki büyüme oranları ile nüfüs büyüme oranları verilmektedir. Söz konusu ülkelerin ekonomik performanslarındaki farklılığın nedenini araştırmak için aşağıdaki regresyon modeli oluşturulmuştur.Tahin edilen denklemde çoklu doğrusal bağlantı olup olmadığını araştırınız.
1.Varyans Büyütme Modeli: Dependent Variable: BUYOR Method: Least Squares Date: 04/08/07 Time: 22:47 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 2.882311 0.858583 3.357054 0.0121 NUFUSBUYOR -1.255668 0.450382 -2.788005 0.0270 PARARZOR 1.408794 0.571991 2.462964 0.0433 SERMSTOKORAN 2.542222 1.231597 2.064167 0.0779 R-squared 0.850682 Mean dependent var 4.300000 Adjusted R-squared 0.786689 S.D. dependent var 1.719884 S.E. of regression 0.794338 Akaike info criterion 2.652673 Sum squared resid 4.416812 Schwarz criterion 2.797362 Log likelihood -10.58970 F-statistic 13.29332 Durbin-Watson stat 1.824943 Prob(F-statistic) 0.002815 1.Varyans Büyütme Modeli: Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir.
1. nolu yardımcı regresyon modeli Depent Variable: NUFUSBUYOR Method: Least Squares Date: 04/08/07 Time: 22:53 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 1.345055 0.477621 2.816157 0.0226 PARARZOR 0.950993 0.297604 3.195500 0.0127 SERMSTOKORAN 0.291956 0.961287 0.303714 0.7691 R-squared 0.901176 Mean dependent var 5.081818 Adjusted R-squared 0.876470 S.D. dependent var 1.774158 S.E. of regression 0.623561 Akaike info criterion 2.120261 Sum squared resid 3.110629 Schwarz criterion 2.228778 Log likelihood -8.661437 F-statistic 36.47588 Durbin-Watson stat 0.974770 Prob(F-statistic) 0.000095
2. nolu yardımcı regresyon modeli =13.73 Dependent Variable: PARARZOR Method: Least Squares Date: 04/08/07 Time: 22:54 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C -0.602064 0.486139 -1.238461 0.2507 NUFUSBUYOR 0.589605 0.184511 3.195500 0.0127 SERMSTOKORAN 1.124048 0.649296 1.731180 0.1217 R-squared 0.927279 Mean dependent var 3.600000 Adjusted R-squared 0.909099 S.D. dependent var 1.628496 S.E. of regression 0.490988 Akaike info criterion 1.642208 Sum squared resid 1.928557 Schwarz criterion 1.750725 Log likelihood -6.032146 F-statistic 51.00486 Durbin-Watson stat 1.800717 Prob(F-statistic) 0.000028
3. nolu yardımcı regresyon denklemi =6.1087 VIF kriterleri 5 ten buyuk çoklu doğrusal bağlantı var diyebiliriz. Dependent Variable: SERMSTOKORAN Method: Least Squares Date: 04/08/07 Time: 22:55 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 0.001490 0.246472 0.006046 0.9953 NUFUSBUYOR 0.039043 0.128552 0.303714 0.7691 PARARZOR 0.242452 0.140050 1.731180 0.1217 R-squared 0.836345 Mean dependent var 1.072727 Adjusted R-squared 0.795431 S.D. dependent var 0.504164 S.E. of regression 0.228030 Akaike info criterion 0.108321 Sum squared resid 0.415981 Schwarz criterion 0.216838 Log likelihood 2.404235 F-statistic 20.44167 Durbin-Watson stat 1.203465 Prob(F-statistic) 0.000717
2.Yardımcı Regresyon Modelleri için F testi 1. nolu yardımcı regresyon modeli 2. nolu yardımcı regresyon modeli R2=0.927279 R2=0.836345 3. nolu yardımcı regresyon modeli k:4 n:11
Klein – Kriteri: Yardımcı regresyon modelleri tahmin edilir ve bunlardan elde edilecek çoklu belirlilik katsayısı ile karşılaştırılarak karar verilebilir. Yardımcı modelin R karesi < ana modelin R karesi nden küçükse çoklu doğrusal bağlantı önemli değildir.
Ana modelin R-squared 0.850682 3 nolu modelde önemli değildir. (sermstokor)
Theil-m Ölçüsü Modelde yer alan tüm bağımsız değişkenler sırası ile modelden çıkarılarak regresyon modelleri tahmin edilir ve her model için çoklu belirlilik katsayıları elde edilir. Ana modelin R-squared 0.850682
1.nolu model Dependent Variable: BUYOR Method: Least Squares Date: 04/08/07 Time: 23:34 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 2.886099 1.018640 2.833286 0.0220 NUFUSBUYOR -1.156412 0.531289 -2.176614 0.0612 PARARZOR 2.025161 0.578811 3.498829 0.0081 R-squared 0.759795 Mean dependent var 4.300000 Adjusted R-squared 0.699744 S.D. dependent var 1.719884 S.E. of regression 0.942421 Akaike info criterion 2.946271 Sum squared resid 7.105252 Schwarz criterion 3.054788 Log likelihood -13.20449 F-statistic 12.65247 Durbin-Watson stat 1.901147 Prob(F-statistic) 0.003329
2. nolu model Dependent Variable: BUYOR Method: Least Squares Date: 04/08/07 Time: 23:37 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 1.193368 0.826796 1.443364 0.1869 PARARZOR 0.214662 0.515174 0.416679 0.6879 SERMSTOKORAN 2.175622 1.664057 1.307420 0.2274 R-squared 0.684877 Mean dependent var 4.300000 Adjusted R-squared 0.606096 S.D. dependent var 1.719884 S.E. of regression 1.079430 Akaike info criterion 3.217744 Sum squared resid 9.321350 Schwarz criterion 3.326261 Log likelihood -14.69759 F-statistic 8.693441 Durbin-Watson stat 1.238019 Prob(F-statistic) 0.009861
3. nolu model Dependent Variable: BUYOR Method: Least Squares Method: Least Squares Date: 04/08/07 Time: 23:39 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 2.034126 1.005135 2.023735 0.0776 NUFUSBUYOR -0.425036 0.381493 -1.114139 0.2976 SERMSTOKORAN 4.125774 1.342475 3.073258 0.0153 R-squared 0.721284 Mean dependent var 4.300000 Adjusted R-squared 0.651605 S.D. dependent var 1.719884 S.E. of regression 1.015161 Akaike info criterion 3.094973 Sum squared resid 8.244417 Schwarz criterion 3.203489 Log likelihood -14.02235 F-statistic 10.35153 Durbin-Watson stat 1.560635 Prob(F-statistic) 0.006035