GÖRÜNÜRDE İLİŞKİSİZ REGRESYON MODELLERİ
Klasik doğrusal regresyon modelinin varsayımları geçerli iken, tek denklemli modellerin “En Küçük Kareler Yöntemi” (EKKY) ile tahmin edilmesi sonucu sapmasız, tutarlı ve etkin tahmin ediciler elde edilebilir. Klasik doğrusal regresyon, modelin spefikasyonunun doğru olduğunu kabul eder. Modelin tahmininde kullanılabilecek bazı diğer bilgiler varsa ve dikkate alınmıyorsa tahmin ediciler klasik doğrusal regresyon modelinin tahmin edicilerle ilgili özelliklerini sağlamayabilir.
GİR modelinde çoklu regresyon denklemlerinin bir kümesi ele alınmaktadır. Bu regresyon denklemler kümesi, eşanlı bir denklemler kümesi biçiminde değildir. Yani herhangi bir denklemde bağımlı değişken olarak bulunan bir değişken bir başka denklemde bağımsız değişken olarak bulunmamaktadır. Zellner, GİR modelini meydana getiren denklemlerin hata terimlerinin ilişkili olduğu, ancak farklı denklemlerdeki bağımsız değişkenler arasında yüksek derecede ilişki olmadığı durumlarda GİR tahmin edicisinin Basit En Küçük Kareler (BEKK) tahmin edicisine göre daha etkin olduğunu göstermiştir(Sezer, 2006).
Bu sistemi meydana getiren çoklu regresyon denklemleri yapısal olarak ilişkisiz gibi görünseler de (eşanlı denklem sistemi özelliğinde olmasalar da) aşağıdaki sebeplerden dolayı istatistiksel olarak ilişkili olabilirler: Bazı katsayılar denklemler arasında ortak kullanılmaktadır. Aynı zaman noktasında, denklemlerdeki karşılıklı hata terimleri ilişkilidir. Denklemlerdeki bağımlı ve bağımsız değişkenler aynıdır, bununla beraber gözlem değerleri aynı değildir. Denklemlerin bir çok ortak yönü mevcuttur.
Sistemde yer alan denklemlerin birbirleri ile ilişkileri, denklemlere ait hata terimlerinin ilişkili olmasından kaynaklanmaktadır. Karşılıklı hataları ilişkili olan denklem sisteminin parametre tahminleri elde edilirken sistem bir bütün olarak ele alınır. Bu yöntem Zellner(1962) tarafından öne sürülen “Görünürde İlişkisiz Regresyon(GİR)” yöntemidir. GİR yönteminin temeli Genelleştirilmiş En Küçük Kareler yöntemine dayanır.
İlişkili olan denklemler sistemine ayrı ayrı basit EKK yöntemi uygulanırsa sapmasız ve tutarlı ancak etkin olmayan tahminciler elde edilir. Hata terimleri ilişkili denklemler sisteminin parametre tahminlerini yaparken sistemi bir bütün olarak ele alan ve hata varyans-kovaryans matrisini de regresyona dahil eden GİR yöntemini kullanmak sapmasız, tutarlı ve etkin tahmin ediciler elde edilmesini sağlar (Doğan,1998).
Görünürde İlişkisiz regresyon denklemlerine Çeşitli malların talep fonksiyonları veya çeşitli endüstri dallarının üretim fonksiyonlarında Bağımlı ve bağımsız değişken verilerinin zaman serisi veya anket verisi olduğu durumlarda Biyokimya, göç, tarım ve nüfus hareketleri, farmakoloji vb. gibi konularda karşılaşılmaktadır.
Görünürde İlişkisiz Regresyonlar… Aynı T zaman dönemi boyunca gözlenmiş ve aynı alanı ilgilendiren iki denklemi (ekonomik göstergeler, yatırım ilişkileri gibi…) göz önüne alalım: (1) (2) Y: bağımlı değişkenler X,Z: açıklayıcı değişkenler
…Görünürde İlişkisiz Regresyonlar… Hatalar ile ilgili olarak basit En Küçük Kareler (BEKK) varsayımlarını kabul edelim: (1) (2) (3) (4) (1) ve (2) ile verilen her iki denklemin hata varyansları farklıdır. Her iki denklemdeki hatalar eşit varyanslı ve birbiriyle ilişkisizdir. Bu varsayımlar altında EKK’in en iyi tahmin tekniği olması (minimum varyanslı, sapmasız) beklenir.
…Görünürde İlişkisiz Regresyonlar… M, modeldeki denklem sayısını, t zamanı ve n denklemlerdeki gözlem sayısını göstermek üzere görünürde ilişkisiz regresyon modelinde hata terimleri üzerindeki varsayımlar: Kov (eit,, ejt) = E(eit,, ejt ) = ij i≠j, t = 1, 2, …, n i, j=1,…..,M varsayıma göre, aynı zaman dönemindeki denklemlerin hata terimleri arasında ilişki vardır. İki denklemli bir sistem için eşitlik tekrar yazılırsa Kov (e1t,, e2t) = E(e1t,, e2t ) = 12 t = 1, 2, …, n şeklinde olacaktır
…Görünürde İlişkisiz Regresyonlar… 2. Kov (eit,, eit) = Var(eit ) = ii varsayıma göre, modeli meydana getiren her bir denklemde sabit varyans varsayımı geçerlidir. İki denklemli bir sistem için eşitlik tekrar yazılırsa Kov (e1t,, e1t) = Var(e1t ) = 11 Kov (e2t,, e2t) = Var(e2t ) = 22
…Görünürde İlişkisiz Regresyonlar… Kov (eit,, ejs) = E(eit,, ejs ) = 0 t≠s varsayıma göre, farklı zaman dönemindeki denklemlerin hata terimleri arasında ilişki yoktur. İki denklemli bir sistem için eşitlik tekrar yazılırsa Kov (e1t,, e2s) = E(e1t,, e2s ) = 0 t≠s elde edilir. 4. Her bir denklemin hata terimleri normal dağılıma sahiptir. 5. Her bir denklemin hata terimlerinin beklenen değeri sıfıra eşittir.
…Görünürde İlişkisiz Regresyonlar… 1., 2. ve 3. varsayımların geçerliliği ile iki denklemli bir sistemde 1. ve 2. denklemlerin hata vektörü için e1 ve e2 yi içeren kovaryans matrisi (5) Hataların farklı zaman dönemlerinde birbirleriyle ilişkisiz oldukları varsayımı altında (6) iki denklemin hataları birbirinden bağımsızdır.
…Görünürde İlişkisiz Regresyonlar… Farklı denklemlerdeki hataların ilişkili olduğu durumda matrisin sağdan köşegen değerleri sıfır olamaz. Farklı dönemlerde hatalar arasında ilişki yoktur. (Varsayım 3) (7)
…Görünürde İlişkisiz Regresyonlar… Aynı zaman dönemindeki denklemlerin hata terimleri arasında ilişki vardır. Farklı zaman dönemlerinde denklemlerin hataları birbirinden bağımsızdır. (8) (9) Hata terimleri varyans-kovaryans matrisinin kösegen olmaması denklemler arasında istatistiksel olarak bir ilişki olduğunu gösterir.
…Görünürde İlişkisiz Regresyonlar… Farklı eşitlikteki hataların dağılımı aşağıdaki şekillerde gösterilebilir: ve (10) veya Zellner bu tip denklemleri hata ilişkili regresyon denklemleri olarak adlandırmıştır.
Eşzamanlı Korelasyonun Test Edilmesi… GİR modelinde hata terimi varyans kovaryans matrisinin köşegen olması denklemlerdeki hata terimleri arasında bir ilişkinin olmadığını gösterir. Bu durumda parametre tahminlerinin GİR yöntemi ile elde edilmesinin bir kazancı olmayacaktır. Bu amaçla varyans kovaryans matrisinin köşegenliginin araştırılması gerekir. Varyans-kovaryans matrisinin köşegen olup olmadığı genel olarak Olabilirlik Oranı (LR) ve Lagrange Çarpanı (LM) ile test edilmektedir.
…Eşzamanlı Korelasyonun Test Edilmesi… Testlerin uygulanması sonucu, LR ve LM’ e ait sıfır hipotez kabul edilirse her bir denklemin “En Küçük Kareler Yöntemi” (EKKY) ile tahmin edilmesi gerekmektedir. M tane denklemden oluşan denklem seti için LM testinin sıfır ve alternatif hipotezleri aşağıdaki gibidir:
…Eşzamanlı Korelasyonun Test Edilmesi… Normal doğrusal model kabulü altında uygun test istatistiği r2 korelasyon karesi, T:Gözlem sayısı :Test istatistiği , M: denklem sayısı , M(M-1)/2 serbestlik derecesinde asimtotik dağılıma sahiptir.
…Eşzamanlı Korelasyonun Test Edilmesi… Eğer tanımlanan anlamlılık seviyesinde dağılımının kritik değerinden büyükse Ho hipotezi reddedilir ve eş zamanlı korelasyonlu olduğu söylenebilir. Örneğin iki denklemlerden oluşan bir sistemde eş zamanlı korelasyon testi için H0 ve H1 hipotezi şu şekilde kurulabilir. Test istatistiği:
M(M-1)/2 serbestlik derecesinde tablo değerine bakılır. H0 reddedilemez. Her iki denklemin hataları arasında bir ilişki yoktur ve denklem tahminleri için EKKY uygulanabilir.
UYGULAMA 1: TARIMSAL ÜRETİM SEKTÖRÜ 1979- 1988 yılları arasında tarım sektöründe ortak özellikleri bulunan benzer iki ürünün fonksiyonları karşılaştırılmak istenmiştir. Buğday ve arpa verimlerine etki eden faktörlerin de aynı olduğu varsayımından hareketle denklem sistemleri arasında görünürde bir ilişkinin olup olmadığını araştırınız.
Tahmin edilecek modeller Bağımlı Değişken Yıllar Arpa Verimi Kg / hektar Arpa Ekili alanı Bin hektar Arpa Üretimi Bin Ton 1979 1871 2800 5240 1980 1893 5300 1981 1990 2965 5900 1982 2040 3137 6400 1983 2900 5425 1984 2000 3250 6500 1985 1949 3350 1986 2103 3343 7000 1987 2092 3314 6900 1988 2189 3445 7500 Bağımlı Değişken Buğday Verimi Kg / hektar Buğday Ekili alanı Bin hektar Buğday Üretimi Bin Ton 1862 9400 17500 1829 9020 16500 1838 9250 17000 1944 9000 1777 9230 16400 1911 17200 9350 2036 19000 2035 9415 18900 2188 9435 20500 Tahmin edilecek modeller log (arpa_verim) = f (logarpa_alan, logarpa_uretimi) log (bugday_verim) = f (logbugday_alan, logbugday_uretimi)
1) Denklemlere EKKY uygulanır. ADIMLAR 1) Denklemlere EKKY uygulanır. a) Birinci Denkleme Ait EKKY Model Tahmin Sonuçları. Dependent Variable: LOG(ARPA_VERIM) Method: Least Squares Sample: 1979 1988 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 6.707761 0.086735 77.33606 0.0000 LOG(ARPA_ALAN) -0.975863 0.029137 -33.49232 LOG(ARPA_URETIM) 1.000880 0.018422 54.33014 R-squared 0.999278 Mean dependent var 7.599514 Adjusted R-squared 0.999071 S.D. dependent var 0.053414 S.E. of regression 0.001628 Akaike info criterion -9.759834 Sum squared resid 1.85E-05 Schwarz criterion -9.669058 Log likelihood 51.79917 F-statistic 4841.716 Durbin-Watson stat 1.835220 Prob(F-statistic) 0.000000
b) Otokorelasyon Testi EKK yöntemi ile tahmin edilen modelde otokorelasyon olup olmadığı incelendiğinde yapılan test sonucuna göre hatalar arasında otokorelasyon olmadığını söyleyen H0 hipotezi kabul edilebilir. Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.047970 Probability 0.833895 Obs*R-squared 0.079316 0.778227
a) İkinci Denkleme Ait EKKY Model Tahmin Sonuçları Dependent Variable: LOG(BUGDAY_VERIM) Method: Least Squares Sample: 1979 1988 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 5.524540 0.774284 7.135032 0.0002 LOG(BUGDAY_ALAN) -0.862321 0.098206 -8.780696 0.0001 LOG(BUGDAY_URETIM) 1.013219 0.026429 38.33666 0.0000 R-squared 0.996025 Mean dependent var 7.561210 Adjusted R-squared 0.994890 S.D. dependent var 0.064257 S.E. of regression 0.004594 Akaike info criterion -7.685018 Sum squared resid 0.000148 Schwarz criterion -7.594243 Log likelihood 41.42509 F-statistic 877.0696 Durbin-Watson stat 2.680469 Prob(F-statistic) 0.000000
b) Otokorelasyon Testi Benzer şekilde buğday verim modelinde hatalar arasında otokorelasyon olup olmadığı incelendiğinde hatalar arasında otokoreasyon olmadığına karar verilebilir. Breusch-Godfrey Serial Correlation LM Test: F-statistic 3.396589 Probability 0.114902 Obs*R-squared 3.614705 0.057271
Estimation Method: Seemingly Unrelated Regression Sample: 1979 1988 System: SYS01 Estimation Method: Seemingly Unrelated Regression Sample: 1979 1988 Included observations: 10 Total system (balanced) observations 20 Linear estimation after one-step weighting matrix Coefficient Std. Error t-Statistic Prob. C 6.726139 0.071981 93.44348 0.000 LOG(ARPA_ALAN) -0.980962 0.024219 -40.50404 0.0000 LOG(ARPA_URETIM) 1.003472 0.015337 65.42920 0.0000 C 5.726876 0.642593 8.912134 0.0000 LOG(BUGDAY_ALAN) -0.885814 0.081570 -10.85959 0.0000 LOG(BUGDAY_URETIM) 1.014466 0.022078 45.94901 0.0000 Determinant residual covariance 2.61E-11
Observations: 10 R-squared 0.999273 Mean dependent var 7.599514 Adjusted R-squared 0.999065 S.D. dependent var 0.053414 S.E. of regression 0.001633 Sum squared resid 1.87E-05 Durbin-Watson stat 1.847210 0.995985 7.561210 0.994838 0.064257 0.004617 0.000149 2.623456
3) Denklemlerin hataları arasında ilişki olup olmadığını araştırmak için eş zamanlı kovaryans testi yapılması gerekmektedir. Eviews programından elde edilen hataların kovaryans matrisi aşağıdaki gibidir. LOG(ARPA_VERIM) LOG(BUGDAY_VERIM) 1.867e-06 1.341e-06 1.491e-05 Matris notasyonu ile gösterimi: 12=0 hipotezinin test edilebilmesi r212 katsayısının hesaplanması gerekmektedir.
M(M-1)/2 serbestlik derecesinde tablo değerine bakılır. 1. Adım 2. Adım 3. Adım M(M-1)/2 serbestlik derecesinde tablo değerine bakılır. 31
EKKY ve SUR Model Sonuçlarının Karşılaştırılması Yöntem EKKY SUR 4. Adım H0 reddedilemez Her iki denklemin hataları arasında bir ilişki olmadığı görülmüştür. Bu durumda iki tarım ürününe ilişkin verimlerin birbirinden etkilenmedikleri yorumu yapılabilir ve denklem tahminleri için EKKY uygulanabilir. EKKY ve SUR Model Sonuçlarının Karşılaştırılması Yöntem EKKY SUR Katsayı Std.Hata C 6.707761 0.086735 6.726139 0.071981 LOG(ARPA_ALAN) -0.975863 0.029137 -0.980962 0.024219 LOG(ARPA_URETIM) 1.000880 0.018422 1.003472 0.015337 5.524540 0.774284 5.726876 0.642593 LOG(BUGDAY_ALAN) -0.862321 0.098206 -0.885814 0.081570 LOG(BUGDAY_URETIM) 1.013219 0.026429 1.014466 0.022078
UYGULAMA 1: TARIMSAL ÜRETİM SEKTÖRÜNDE (Çavdar ve Yulaf) Aşağıdaki tablolarda 1979- 1988 yılları arasında tarım sektöründen benzer iki ürünün fonksiyonları karşılaştırılmak istenmiştir. Çavdar ve yulaf verimlerine etki eden faktörlerin aynı olduğu varsayımından hareketle denklemler sistemleri arasında görünürde bir ilişkin olup olmadığını araştırınız.
Tahmin edilecek modeller Bağımlı Değişken Yıllar Çavdar Verimi Kg / hektar Çavdar Ekili alanı Bin/ hektar Çavdar Üretimi Bin/ Ton 1979 1319 470 620 1980 1186 443 525 1981 1293 410 530 1982 1376 313 430 1983 1382 275 380 1984 1440 250 360 1985 1550 240 1986 1585 222 350 1987 1581 242 1988 1567 180 280 Bağımlı Değişken Yulaf Verimi Kg / hektar Yulaf Ekili alanı Bin / hektar Yulaf Üretimi Bin / Ton 1682 220 370 1802 197 355 1806 180 325 1886 175 330 1882 170 320 1837 172 316 1883 167 314 1899 158 300 1826 178 1852 149 276 Tahmin edilecek modeller log (cavdar_verim) = f (cavdar _uretim, cavdar _alan) log (yulaf _verim) = f (yulaf _uretim, yulaf_alan)
1) Denklemlere EKKY uygulanır. ADIMLAR 1) Denklemlere EKKY uygulanır. a) Birinci Denkleme Ait EKKY Model Tahmin Sonuçları. Dependent Variable: LOG(CAVDAR_VERIM) Method: Least Squares Sample: 1979 1988 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 6.918401 0.165405 41.82715 0.0000 LOG(CAVDAR_ALAN) -1.039640 0.061805 -16.82126 LOG(CAVDAR_URETIM) 1.036502 0.082988 12.48973 R-squared 0.991830 Mean dependent var 7.259539 Adjusted R-squared 0.989495 S.D. dependent var 0.099751 S.E. of regression 0.010224 Akaike info criterion -6.084883 Sum squared resid 0.000732 Schwarz criterion -5.994107 Log likelihood 33.42441 F-statistic 424.8800 Durbin-Watson stat 2.589341 Prob(F-statistic) 0.000000
Breusch-Godfrey Serial Correlation LM Test: b) Otokorelasyon Testi EKK yöntemi ile tahmin edilen modelde otokorelasyon olup olmadığı incelendiğinde yapılan test sonucuna göre hatalar arasında otokorelasyon olmadığını söyleyen H0 hipotezi kabul edilebilir. Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.689292 Probability 0.438185 Obs*R-squared 1.030441 0.310055
a) İkinci Denkleme Ait EKKY Model Tahmin Sonuçları Dependent Variable: LOG(YULAF_VERIM) Method: Least Squares Sample: 1979 1988 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 6.896845 0.020446 337.3201 0.0000 LOG(YULAF_ALAN) -1.004484 0.006842 -146.8164 LOG(YULAF_URETIM) 1.005932 0.009182 109.5515 R-squared 0.999830 Mean dependent var 7.514506 Adjusted R-squared 0.999782 S.D. dependent var 0.035754 S.E. of regression 0.000528 Akaike info criterion -12.01140 Sum squared resid 1.95E-06 Schwarz criterion -11.92062 Log likelihood 63.05699 F-statistic 20626.82 Durbin-Watson stat 2.268799 Prob(F-statistic) 0.000000
Breusch-Godfrey Serial Correlation LM Test: b) Otokorelasyon Testi EKK yöntemi ile tahmin edilen modelde otokorelasyon olup olmadığı incelendiğinde yapılan test sonucuna göre hatalar arasında otokorelasyon olmadığını söyleyen H0 hipotezi kabul edilebilir. Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.142993 Probability 0.718341 Obs*R-squared 0.232774 0.629475
2) Denklemlerin SUR ile tahmini aşağıdaki gibidir. System: SYS01 Estimation Method: Seemingly Unrelated Regression Sample: 1979 1988 Included observations: 10 Total system (balanced) observations 20 Linear estimation after one-step weighting matrix Coefficient Std. Error t-Statistic Prob. C 7.056788 0.077382 91.19375 0.0000 LOG(CAVDAR_ALAN) -0.993493 0.021759 -45.65882 LOG(CAVDAR_URETIM) 0.970014 0.030907 31.38527 6.906474 0.008800 784.8325 LOG(YULAF_ALAN) -1.002821 0.002490 -402.7346 LOG(YULAF_URETIM) 1.002776 0.003231 310.4000 Determinant residual covariance 5.26E-13
R-squared 0.991008 Mean dependent var 7.259539 Adjusted R-squared Equation:LOG(CAVDAR_VERIM) =C(1)+C(2)*LOG(CAVDAR_ALAN) +C(3)*LOG(CAVDAR_URETIM) Observations: 10 R-squared 0.991008 Mean dependent var 7.259539 Adjusted R-squared 0.988439 S.D. dependent var 0.099751 S.E. of regression 0.010725 Sum squared resid 0.000805 Durbin-Watson stat 2.441828 Equation: LOG(YULAF_VERIM) =C(4) +C(5)*LOG(YULAF_ALAN) + C(6)*LOG(YULAF_URETIM) 0.999824 7.514506 0.999774 0.035754 0.000538 2.03E-06 2.266296
3) Denklemlerin hataları arasında ilişki olup olmadığını araştırmak için eş zamanlı kovaryans testi yapılması gerekmektedir. Eviews programından elde edilen hataların kovaryans matrisi aşağıdaki gibidir. LOG(CAVDAR_VERIM) LOG(YULAF_VERIM) 8.052e-05 3.973e-06 2.026e-07 Matris notasyonu ile gösterimi 12 = 0 hipotezinin test edilebilmesi r212 katsayısının hesaplanması gerekmektedir.
M(M-1)/2 serbestlik derecesinde tablo değerine bakılır. 1. Adım 3. Adım M(M-1)/2 serbestlik derecesinde tablo değerine bakılır. 42
4. Adım Her iki denklemin hataları arasında bir ilişki olduğu görülmüştür. Bu durumda iki tarım ürününe ilişkin verimlerin birbirinden etkilendikleri yorumu yapılabilir ve denklem tahminleri için GİR uygulanabilir. 43