Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü. Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan.

Benzer bir sunumlar


... konulu sunumlar: "Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü. Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan."— Sunum transkripti:

1 Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü

2 Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan bahsetmek gerekmektedir. *Bu konu Christopher Dougherty’, Inroduction to Econometrics kitabının slaytlarından çevrilerek hazırlanmıştır.

3 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 2 Yukarıda verilen model iki durum bakımından dorusaldır. Model değişkenler bakımından doğrusaldır. Ayrıca parametreler bakımından da doğrusaldır.

4 Değişkenlerde ve parametrelerde doğrusallık durumu: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 3 Parametreler her bir terimde çarpımsal olarak yer almaktadır.

5 Değişken ve parametre bakımından doğrusallık: Parametre bakımından doğrusal, değişken bakımından doğrusal olmama: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 4 İkinci model parametre bakımından doğrusalken, değişken bakımından doğrusal değildir.

6 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 5 Bu modellerde bir sorun yoktur. Yeni değişkenler yukarıdaki gibi tanımlanabilir.

7 Değişkenlerde ve parametrelerde doğrusallık durumu : Parametrelerde doğrusal değişkenlerde doğrusal olmama durumu: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 6 Yapılan yüzeysel dönüşümler ile hem parametre hem de değişkenler doğrusal duruma getirilir.

8 Değişkenlerde ve parametrelerde doğrusallık durumu: Parametrelerde doğrusal değişkenlerde doğrusal olmama durumu: Parametre bakımından doğrusal olmama durumu: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 7 Üçüncü model katsayı bakımından doğrusal değildir. X 4 değişkeninin katsayısı, X 2 ve X 3 değişkenleri katsayılarının çarpımıdır. Parametre bakımından doğrusal olmayan modeller uygun dönüşümler sayesinde doğrusallaştırılabilir.

9 Muz Gelir (lbs) ($10,000) Hanehalkı Y X 11.711 26.882 38.253 49.524 59.815 611.436 711.097 810.878 912.159 1010.9410 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 8 Doğrusallaştırma için yukarıdaki örnek ile başlayalım. 10 hanehalkına ait yıllık muz tüketimi ve yıllık gelir bilgileri yukarıdaki gibidir.

10 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 9 Verilerin dağılımı grafikte verilmiştir. X Y

11 . reg Y X Source | SS df MS Number of obs = 10 ---------+------------------------------ F( 1, 8) = 17.44 Model | 58.8774834 1 58.8774834 Prob > F = 0.0031 Residual | 27.003764 8 3.3754705 R-squared = 0.6856 ---------+------------------------------ Adj R-squared = 0.6463 Total | 85.8812475 9 9.54236083 Root MSE = 1.8372 ------------------------------------------------------------------------------ Y | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- X |.8447878.2022741 4.176 0.003.378343 1.311233 _cons | 4.618667 1.255078 3.680 0.006 1.724453 7.512881 ------------------------------------------------------------------------------ DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 10 Doğrusal modelin sonuçları çıktı olarak verilmiştir. Dağılma diyagramından görüldüğü gibi X’in katsayısı istatistiksel olarak anlamlıdır. R 2 değeri oldukça iyidir.

12 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 11 Regresyon doğrusu çizildikten sonra dağılım diyagramı yukarıda yine verilmiştir. X Y

13 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 12 Grafiğe tahmin değerleri ve hata terimleri eklenmiştir. Hata terimleri modelin bazı bakımlardan yanlış belirlenmiş olabileceğini göstermektedir. X Y

14 13 Eğer model doğru olarak belirlenmiş olsaydı hata terimleri tesadüfi olarak dağılacaktı. Bu durumda tesadüfi değildir. Negatif hata terimini altı tane pozitif hata terimi ve bunları da üç tane negatif hata terimi takip etmektedir. X Y DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

15 Yeniden düzenlenmiş model: 14 Y değişkeninin ilişkisinin 1/X ile daha uygun olabilir. Eğer  2 < 0 ise, Y değişkeni X ile yine artacaktır, fakat artış oranı düşecektir. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

16 Gözden geçirilmiş model : 15 Yukarıdaki model doğusal değildir. X değişkeninin tersi olarak bir Z değişkeni tanımlanırsa model doğrusal olabilecektir. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

17 Muz Gelir (lbs) ($10,000) HanehalkıY X Z=1/X 11.7111.00 26.8820.50 38.2530.33 49.5240.25 59.8150.20 611.4360.17 711.0970.14 810.8780.13 912.1590.11 1010.94100.10 16 Yeni adım Z değişkenini X değişkeni yardımı ile hesaplamaktır. Böylece eski değişkenlerden yeni değişkenler elde edilebilir. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

18 17 Bu kez Y ve Z arasındaki dağılma diyagramı yukarıdaki gibidir. Y Z DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

19 . g Z=1/X. reg Y Z Source | SS df MS Number of obs = 10 ---------+------------------------------ F( 1, 8) = 286.10 Model | 83.5451508 1 83.5451508 Prob > F = 0.0000 Residual | 2.33609666 8.292012083 R-squared = 0.9728 ---------+------------------------------ Adj R-squared = 0.9694 Total | 85.8812475 9 9.54236083 Root MSE =.54038 ------------------------------------------------------------------------------ Y | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- Z | -10.98865.6496573 -16.915 0.000 -12.48677 -9.490543 _cons | 12.48354.2557512 48.811 0.000 11.89378 13.07331 ------------------------------------------------------------------------------ 18 Yeni Z değişkeni ile elde edilen model çıktısı yukarıdadır. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

20 . g Z=1/X. reg Y Z Source | SS df MS Number of obs = 10 ---------+------------------------------ F( 1, 8) = 286.10 Model | 83.5451508 1 83.5451508 Prob > F = 0.0000 Residual | 2.33609666 8.292012083 R-squared = 0.9728 ---------+------------------------------ Adj R-squared = 0.9694 Total | 85.8812475 9 9.54236083 Root MSE =.54038 ------------------------------------------------------------------------------ Y | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- Z | -10.98865.6496573 -16.915 0.000 -12.48677 -9.490543 _cons | 12.48354.2557512 48.811 0.000 11.89378 13.07331 ------------------------------------------------------------------------------ 19 Regresyon modeli DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

21 20 Regresyon doğrusu ve verilerin dağılım diyagramı Z Y DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

22 21 X değişkeninin tersini alarak Z değişkeninin yer alması ve elde edilen modelin orijinal veriler ile grafiği çizildiğinde daha uygun olduğu görülmektedir. X Y DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

23 1 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ Doğrusal olmayan regresyon modellerinin hata yapısını ele alalım.

24 2 Doğrusal modellerde regresyon sonuçları istenilen özelliklere sahiptir. Dönüştürülen modelde hata terimi toplamsal olmalıdır ve Gauss-Markov şartlarını sağlamalıdır. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

25 3 Geleneksel testlerin gerçekleştirilebilmesi için, dönüştürülmüş model hata terimi normal dağılmalıdır. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

26 4 Eğer orijinal modeldeki hata terimleri istenilen özelliklere sahip ise, doğrusal olmayan regresyon modelindeki hata terimleri de istenilen özelliklere sahiptir. Dönüşümden etkilenmemektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

27 5 Log-log bir modelde hata terimi dışlansın. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

28 6 Bununla birlikte, dönüştürülmüş modelde hata teriminin toplamsal olduğu varsayılsın. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

29 7 Ancak orjinal modelde tesadüfi bileşen çarpımsaldır. e u. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

30 8 Orijinal modeldeki çarpımsal terimi v ile gösterelim. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

31 9 u sıfıra eşit olduğunda, log Y değerini değiştirmeye gerek yoktur. Aynı biçimde v 1’e eşit olduğunda ise Y değerini değiştirmeye gerek yoktur. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

32 10 1 değerinden büyük olan v değerlerine karşılık gelen pozitif u değerleri, tesadüfi faktör Y ve log Y üzerinde pozitif etkiye sahiptir. 0 ve 1 değerleri arasındaki v değerlerine karşılık gelen negatif u değerleri, tesadüfi faktör Y ve log Y üzerinde negatif etkiye sahiptir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

33 v f(v)f(v) 11 Ayrıca Gauss-Markov şartlarını sağlanması, t ve F testlerini gerçekleştirebilmek için u teriminin normal dağılması gerekmektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

34 v f(v)f(v) 12 Eğer v lognormal dağılıma sahip ise şekli yukarıdaki gibi olacaktır. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

35 13 u = 0 iken, dağılımın modu v =1 olmaktadır. v f(v)f(v) DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

36 14 Aynı çarpımsal hata terimi yarı-logaritmik modelde de olmalıdır. v f(v)f(v) DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

37 15 Bu dağılımda büyük pozitif tesadüfi etkiye maruz kalan gözlemlerde küçük oransal değişme beklenecektir. v f(v)f(v) DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

38 16 Örnekte kazanç ve eğitim yılına ait verilerin dağılımı yukarıdaki gibidir. Birçok aykırı gözlem bulunmaktadır ve bunların üç tanesi sarı ile gösterilmiştir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

39 17 Yukarıda yarı-logaritmik modelin regresyon doğrusu etrafındaki dağılma diyagramı gösterilmektedir. Aynı üç değer hala aykırı gözlem olarak görülmektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

40 18 Yukarıdaki histogram doğrusal ve yarı-logaritmik modellerin hata terimlerini karşılaştırmaktadır. Hata terimleri standart sapması bir olacak şekilde standartlaştırıldığında karşılaştırılabilir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

41 19 Eğer regresyon modelindeki hata terimi normal dağılıyorsa yukarıdaki gibi gösterilir DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

42 20 Yarı-logaritmik modelden elde edilen hata terimleri yaklaşık olarak normal iken; doğusal modelden elde edilen model hata terimleri normal değildir. Bu da yarı-logaritmik modelin daha iyi tanımlama olduğunu göstermektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

43 21 Eğer tam logaritmik yada yarı-logaritmik model hata terimi çarpımsal yerine toplamsal olursa ne olur? DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

44 22 Eğer böyle bir durum söz konusu ise, verilerin logaritması alınarak doğrusallaştırılamaz. log(  1 X  + u)’i basitleştirmenin bir yolu yoktur. Bu durum için bazı doğrusal olmayan tekniklerin kullanılması gerekmektedir. 2 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

45 1 BOX-COX TESTİ * Bir regresyon modelinin tanımlanmasında bağımlı değişken aynı iken R 2, modelleri karşılaştırmak için kulllanılabilir. * Bu konu Applied Econoemtrics A Modern Approach” Dimitrios Asterious and Stephen G. Hall, Basic Econometrics, Damodar Guharati ve Econometrics Models and Economic Forecasting, Pindcyk ve Rubinfield kitaplarından alınmıştır.

46 2 Ancak bağımlı değişken aynı değilse karşılaştırma yapılamaz. BOX-COX TESTİ

47 4 Bu modeller aynı değildir ve karşılaştırma yapılamaz. Farklı fonksiyonel biçimlerin Box-Cox dönüşümü ile karşılaştırılması mümkündür. BOX-COX TESTİ

48 Box-Cox dönüşümü yapılmadan önce Box-Cox dönüşüm parametresi olan λ nın bulunması gerekmektedir. λ belirlendikten sonra bağlım değişkene ilişkin dönüşüm aşağıdaki gibi yapılmaktadır. λ değeri eğer sıfır olarak bulunmuş ise, gerçek bağımlı değişken(Y) ile logaritmik bağımlı değişken (logY) birbiri yerine kullanılabilmektedir. λ nın sıfırdan farklı olması durumunda yukarıdaki formülden hesaplanan yeni bağımlı değişkeni oluşturulup Box-Cox testi aşamaları gerçekleştirilebilir.

49 BOX-COX TESTİ DeğeriRegresyon Modeli 1 2 0.5 0 -0.5 negatif, pozitif ya da sıfır olabilmektedir. (1) nolu eşitlik Box-Cox regresyon modeli olarak adlandırılmaktadır. aldığı değerlere göre Tablodaki modeller elde edilmektedir. Doğrusal ve logaritmik-doğrusal modeller Box-Cox dönüşümünün özel durumlarıdır.

50 BOX-COX TESTİ denklemindeyerine konursa olmaktadır.

51 BOX-COX TESTİ = 0 olduğu zaman (Y - 1) / belirsiz olmaktadır. Taylor serisi açılımı kullanılarak Y aşağıdaki gibi ifade edilebilir:

52 En çok olabilirlik fonksiyonu ile parametre tahminleri yapılabilmesi için logaritmik olabilirlik fonksiyonu:  (2) nolu olabilirlik fonksiyonu = 0 ve =1 olduğunda verilere en uygun olan modelin seçimde ve karşılaştırılmasında kullanılabilmektedir.  En çok olabilirlik çözümü için program uygun olmadığında doğrusal ve log-doğusal model karşılaştırması için en küçük kareler yöntemi kullanılabilmektedir.  Karşılaştırmanın yapılabilmesi için Box-Cox dönüşüm testi uygulanabilir. BOX-COX TESTİ

53 (3) (4) En küçük kareler yaklaşımı kullanarak her iki denklemde karşılaştırılabilir. Bunun için orijinal Y gözlemleri geometrik ortalamalarına bölünerek normalleştirilebilmektedir. Normalize edilen Y değişkeni kullanılarak doğrusal ve log- doğrusal model karşılaştırılabilmektedir.

54 BOX-COX TESTİ 1.Adım: Y gözlemlerinin geometrik ortalaması alınır. 2.Adım: Y gözlemleri geometrik ortalamalarına bölünerek Y * değişkenine dönüştürülür. (3) (4)

55 BOX-COX TESTİ 3.Adım: (3) ve (4) nolu modellerde bağımlı değişken yerine Y * değişkeni konur. (3) (4) (5) (6)

56 BOX-COX TESTİ (5) (6) 4.Adım: (5) ve (6) nolu modellerden elde edilen hata kareler toplamına göre ki-kare kritik değeri elde edilir. Serbestlik derecesi 1 olan ki-kare tablo değeri ile karşılaştırılır. Sonuç olarak eğer test değeri tablo değerinden büyük ise daha küçük hata kareler toplamına sahip modelin daha iyi olduğu ifade edilebilir.

57 BOX-COX TESTİ Örnek: 1985:1-1994:2 dönemleri arasında tüketim, gelir ve tüketici fiyat indeksi verileri verilmiştir. İki türlü tüketim fonksiyonu tanımlanmıştır. C t : reel tüketim, Y t : reel gelir Her iki modeli karşılaştırabilmek için reel hale getirilen değişkenlerin logaritması alınarak dönüştürme adımlarına başlanabilir.

58 BOX-COX TESTİ C değişkenin geometrik ortalaması alınır. C * değişkeni (3) ve (4) nolu modellerde bağımlı değişken yerine kullanılır ve (5) ve (6) nolu modeller ayrı ayrı tahminlenir: (5) (6) λ=0 olduğu için logaritmik C değişkeni kullanılmıştır.

59 (5) nolu model: Dependent Variable: C * Method: Least Squares Sample: 1985Q1 1994Q2 Included observations: 38 VariableCoefficientStd. Errort-StatisticProb. Y0.0150860.0019257.8351140.0000 C-0.4805740.189967-2.5297740.0159 R-squared0.630348 Mean dependent var1.005590 Adjusted R-squared0.620080 S.D. dependent var0.104430 S.E. of regression0.064368 Akaike info criterion-2.597195 Sum squared resid0.149158 Schwarz criterion-2.511006 Log likelihood51.34670 F-statistic61.38901 Durbin-Watson stat0.136686 Prob(F-statistic)0.000000

60 (6) nolu model. Dependent Variable: lnC * Method: Least Squares Sample: 1985Q1 1994Q2 Included observations: 38 VariableCoefficientStd. Errort-StatisticProb. C-1.5769790.191307-8.2432060.0000 Y 0.0160080.0019398.2556870.0000 R-squared0.654366 Mean dependent var9.79E-16 Adjusted R-squared0.644765 S.D. dependent var0.108759 S.E. of regression0.064822 Akaike info criterion-2.583144 Sum squared resid0.151269 Schwarz criterion-2.496955 Log likelihood51.07973 F-statistic68.15636 Durbin-Watson stat0.117352 Prob(F-statistic)0.000000

61 Model karşılaştırması Logaritmik fonksiyonun doğrusa l modelden daha iyi olduğu s ö ylenemez H 0 : Model tahminleri arasında fark yoktur. H 1 : Hata kareler toplamı küçük olan model daha iyidir.

62 9 BOX-COX TESTİ ÖRNEK 2 Aşağıdaki iki model karşılaştırılmak istensin. Bir önceki örnekte olduğu gibi bağımlı değişkenin geometrik ortalaması alınarak bağımlı değişken gözlemleri geometrik ortalamaya bölünür.

63 10 BOX-COX TESTİ Kazanç denklemini doğrusal ve yarı logaritmik biçimde karşılaştırmak için yukarıdaki testi uygulayacağız. EARN * elde edildikten sonra aşağıdaki iki model tahminlenebilir. Karşılaştırma amaçlı aşağıdaki test istatistiği hesaplanır. λ≠0 olduğu için bağımlı değişkenin logaritması alınarak iki model elde edilmiştir.

64 . reg EARNSTAR S Source | SS df MS Number of obs = 570 ---------+------------------------------ F( 1, 568) = 65.64 Model | 30.8184248 1 30.8184248 Prob > F = 0.0000 Residual | 266.69807 568.469538855 R-squared = 0.1036 ---------+------------------------------ Adj R-squared = 0.1020 Total | 297.516494 569.522876089 Root MSE =.68523 ------------------------------------------------------------------------------ EARNSTAR | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- S |.0944558.0116589 8.102 0.000.0715559.1173557 _cons | -.1224433.1602326 -0.764 0.445 -.437164.1922774 ------------------------------------------------------------------------------ 17 EARNSTAR’nın S ye göre regresyonu alınır. Hata kareleri toplamı bulunur. BOX-COX TESTİ

65 . reg LGEARNST S Source | SS df MS Number of obs = 570 ---------+------------------------------ F( 1, 568) = 93.21 Model | 21.6812545 1 21.6812545 Prob > F = 0.0000 Residual | 132.120642 568.232606764 R-squared = 0.1410 ---------+------------------------------ Adj R-squared = 0.1395 Total | 153.801897 569.270302103 Root MSE =.48229 ------------------------------------------------------------------------------ LGEARNST | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- S |.0792256.0082061 9.655 0.000.0631077.0953435 _cons | -1.071214.1127785 -9.498 0.000 -1.292727 -.8496999 ------------------------------------------------------------------------------ 18 LGEARNST’nın de regresyonu alınır ve hata kareler toplamı alınır. BOX-COX TESTİ

66 19 Test istatistiği 200.2 dir. Kikare tablo değeriyle karşılaştırıldığında yarı logaritmik modelin daha iyi olduğuna karar verilir. BOX-COX TESTİ H 0 : Model tahminleri arasında fark yoktur. H 1 : Hata kareler toplamı küçük model daha iyidir.


"Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü. Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan." indir ppt

Benzer bir sunumlar


Google Reklamları