Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü. Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan.

Benzer bir sunumlar


... konulu sunumlar: "Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü. Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan."— Sunum transkripti:

1 Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü

2 Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan bahsetmek gerekmektedir. *Bu konu Christopher Dougherty’, Inroduction to Econometrics kitabının slaytlarından çevrilerek hazırlanmıştır.

3 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 2 Yukarıda verilen model iki durum bakımından dorusaldır. Model değişkenler bakımından doğrusaldır. Ayrıca parametreler bakımından da doğrusaldır.

4 Değişkenlerde ve parametrelerde doğrusallık durumu: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 3 Parametreler her bir terimde çarpımsal olarak yer almaktadır.

5 Değişken ve parametre bakımından doğrusallık: Parametre bakımından doğrusal, değişken bakımından doğrusal olmama: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 4 İkinci model parametre bakımından doğrusalken, değişken bakımından doğrusal değildir.

6 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 5 Bu modellerde bir sorun yoktur. Yeni değişkenler yukarıdaki gibi tanımlanabilir.

7 Değişkenlerde ve parametrelerde doğrusallık durumu : Parametrelerde doğrusal değişkenlerde doğrusal olmama durumu: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 6 Yapılan yüzeysel dönüşümler ile hem parametre hem de değişkenler doğrusal duruma getirilir.

8 Değişkenlerde ve parametrelerde doğrusallık durumu: Parametrelerde doğrusal değişkenlerde doğrusal olmama durumu: Parametre bakımından doğrusal olmama durumu: DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 7 Üçüncü model katsayı bakımından doğrusal değildir. X 4 değişkeninin katsayısı, X 2 ve X 3 değişkenleri katsayılarının çarpımıdır. Parametre bakımından doğrusal olmayan modeller uygun dönüşümler sayesinde doğrusallaştırılabilir.

9 Muz Gelir (lbs) ($10,000) Hanehalkı Y X DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 8 Doğrusallaştırma için yukarıdaki örnek ile başlayalım. 10 hanehalkına ait yıllık muz tüketimi ve yıllık gelir bilgileri yukarıdaki gibidir.

10 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 9 Verilerin dağılımı grafikte verilmiştir. X Y

11 . reg Y X Source | SS df MS Number of obs = F( 1, 8) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = Y | Coef. Std. Err. t P>|t| [95% Conf. Interval] X | _cons | DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 10 Doğrusal modelin sonuçları çıktı olarak verilmiştir. Dağılma diyagramından görüldüğü gibi X’in katsayısı istatistiksel olarak anlamlıdır. R 2 değeri oldukça iyidir.

12 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 11 Regresyon doğrusu çizildikten sonra dağılım diyagramı yukarıda yine verilmiştir. X Y

13 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU 12 Grafiğe tahmin değerleri ve hata terimleri eklenmiştir. Hata terimleri modelin bazı bakımlardan yanlış belirlenmiş olabileceğini göstermektedir. X Y

14 13 Eğer model doğru olarak belirlenmiş olsaydı hata terimleri tesadüfi olarak dağılacaktı. Bu durumda tesadüfi değildir. Negatif hata terimini altı tane pozitif hata terimi ve bunları da üç tane negatif hata terimi takip etmektedir. X Y DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

15 Yeniden düzenlenmiş model: 14 Y değişkeninin ilişkisinin 1/X ile daha uygun olabilir. Eğer  2 < 0 ise, Y değişkeni X ile yine artacaktır, fakat artış oranı düşecektir. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

16 Gözden geçirilmiş model : 15 Yukarıdaki model doğusal değildir. X değişkeninin tersi olarak bir Z değişkeni tanımlanırsa model doğrusal olabilecektir. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

17 Muz Gelir (lbs) ($10,000) HanehalkıY X Z=1/X Yeni adım Z değişkenini X değişkeni yardımı ile hesaplamaktır. Böylece eski değişkenlerden yeni değişkenler elde edilebilir. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

18 17 Bu kez Y ve Z arasındaki dağılma diyagramı yukarıdaki gibidir. Y Z DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

19 . g Z=1/X. reg Y Z Source | SS df MS Number of obs = F( 1, 8) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = Y | Coef. Std. Err. t P>|t| [95% Conf. Interval] Z | _cons | Yeni Z değişkeni ile elde edilen model çıktısı yukarıdadır. DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

20 . g Z=1/X. reg Y Z Source | SS df MS Number of obs = F( 1, 8) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = Y | Coef. Std. Err. t P>|t| [95% Conf. Interval] Z | _cons | Regresyon modeli DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

21 20 Regresyon doğrusu ve verilerin dağılım diyagramı Z Y DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

22 21 X değişkeninin tersini alarak Z değişkeninin yer alması ve elde edilen modelin orijinal veriler ile grafiği çizildiğinde daha uygun olduğu görülmektedir. X Y DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU

23 1 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ Doğrusal olmayan regresyon modellerinin hata yapısını ele alalım.

24 2 Doğrusal modellerde regresyon sonuçları istenilen özelliklere sahiptir. Dönüştürülen modelde hata terimi toplamsal olmalıdır ve Gauss-Markov şartlarını sağlamalıdır. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

25 3 Geleneksel testlerin gerçekleştirilebilmesi için, dönüştürülmüş model hata terimi normal dağılmalıdır. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

26 4 Eğer orijinal modeldeki hata terimleri istenilen özelliklere sahip ise, doğrusal olmayan regresyon modelindeki hata terimleri de istenilen özelliklere sahiptir. Dönüşümden etkilenmemektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

27 5 Log-log bir modelde hata terimi dışlansın. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

28 6 Bununla birlikte, dönüştürülmüş modelde hata teriminin toplamsal olduğu varsayılsın. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

29 7 Ancak orjinal modelde tesadüfi bileşen çarpımsaldır. e u. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

30 8 Orijinal modeldeki çarpımsal terimi v ile gösterelim. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

31 9 u sıfıra eşit olduğunda, log Y değerini değiştirmeye gerek yoktur. Aynı biçimde v 1’e eşit olduğunda ise Y değerini değiştirmeye gerek yoktur. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

32 10 1 değerinden büyük olan v değerlerine karşılık gelen pozitif u değerleri, tesadüfi faktör Y ve log Y üzerinde pozitif etkiye sahiptir. 0 ve 1 değerleri arasındaki v değerlerine karşılık gelen negatif u değerleri, tesadüfi faktör Y ve log Y üzerinde negatif etkiye sahiptir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

33 v f(v)f(v) 11 Ayrıca Gauss-Markov şartlarını sağlanması, t ve F testlerini gerçekleştirebilmek için u teriminin normal dağılması gerekmektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

34 v f(v)f(v) 12 Eğer v lognormal dağılıma sahip ise şekli yukarıdaki gibi olacaktır. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

35 13 u = 0 iken, dağılımın modu v =1 olmaktadır. v f(v)f(v) DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

36 14 Aynı çarpımsal hata terimi yarı-logaritmik modelde de olmalıdır. v f(v)f(v) DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

37 15 Bu dağılımda büyük pozitif tesadüfi etkiye maruz kalan gözlemlerde küçük oransal değişme beklenecektir. v f(v)f(v) DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

38 16 Örnekte kazanç ve eğitim yılına ait verilerin dağılımı yukarıdaki gibidir. Birçok aykırı gözlem bulunmaktadır ve bunların üç tanesi sarı ile gösterilmiştir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

39 17 Yukarıda yarı-logaritmik modelin regresyon doğrusu etrafındaki dağılma diyagramı gösterilmektedir. Aynı üç değer hala aykırı gözlem olarak görülmektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

40 18 Yukarıdaki histogram doğrusal ve yarı-logaritmik modellerin hata terimlerini karşılaştırmaktadır. Hata terimleri standart sapması bir olacak şekilde standartlaştırıldığında karşılaştırılabilir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

41 19 Eğer regresyon modelindeki hata terimi normal dağılıyorsa yukarıdaki gibi gösterilir DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

42 20 Yarı-logaritmik modelden elde edilen hata terimleri yaklaşık olarak normal iken; doğusal modelden elde edilen model hata terimleri normal değildir. Bu da yarı-logaritmik modelin daha iyi tanımlama olduğunu göstermektedir. DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

43 21 Eğer tam logaritmik yada yarı-logaritmik model hata terimi çarpımsal yerine toplamsal olursa ne olur? DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

44 22 Eğer böyle bir durum söz konusu ise, verilerin logaritması alınarak doğrusallaştırılamaz. log(  1 X  + u)’i basitleştirmenin bir yolu yoktur. Bu durum için bazı doğrusal olmayan tekniklerin kullanılması gerekmektedir. 2 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ

45 1 BOX-COX TESTİ * Bir regresyon modelinin tanımlanmasında bağımlı değişken aynı iken R 2, modelleri karşılaştırmak için kulllanılabilir. * Bu konu Applied Econoemtrics A Modern Approach” Dimitrios Asterious and Stephen G. Hall, Basic Econometrics, Damodar Guharati ve Econometrics Models and Economic Forecasting, Pindcyk ve Rubinfield kitaplarından alınmıştır.

46 2 Ancak bağımlı değişken aynı değilse karşılaştırma yapılamaz. BOX-COX TESTİ

47 4 Bu modeller aynı değildir ve karşılaştırma yapılamaz. Farklı fonksiyonel biçimlerin Box-Cox dönüşümü ile karşılaştırılması mümkündür. BOX-COX TESTİ

48 Box-Cox dönüşümü yapılmadan önce Box-Cox dönüşüm parametresi olan λ nın bulunması gerekmektedir. λ belirlendikten sonra bağlım değişkene ilişkin dönüşüm aşağıdaki gibi yapılmaktadır. λ değeri eğer sıfır olarak bulunmuş ise, gerçek bağımlı değişken(Y) ile logaritmik bağımlı değişken (logY) birbiri yerine kullanılabilmektedir. λ nın sıfırdan farklı olması durumunda yukarıdaki formülden hesaplanan yeni bağımlı değişkeni oluşturulup Box-Cox testi aşamaları gerçekleştirilebilir.

49 BOX-COX TESTİ DeğeriRegresyon Modeli negatif, pozitif ya da sıfır olabilmektedir. (1) nolu eşitlik Box-Cox regresyon modeli olarak adlandırılmaktadır. aldığı değerlere göre Tablodaki modeller elde edilmektedir. Doğrusal ve logaritmik-doğrusal modeller Box-Cox dönüşümünün özel durumlarıdır.

50 BOX-COX TESTİ denklemindeyerine konursa olmaktadır.

51 BOX-COX TESTİ = 0 olduğu zaman (Y - 1) / belirsiz olmaktadır. Taylor serisi açılımı kullanılarak Y aşağıdaki gibi ifade edilebilir:

52 En çok olabilirlik fonksiyonu ile parametre tahminleri yapılabilmesi için logaritmik olabilirlik fonksiyonu:  (2) nolu olabilirlik fonksiyonu = 0 ve =1 olduğunda verilere en uygun olan modelin seçimde ve karşılaştırılmasında kullanılabilmektedir.  En çok olabilirlik çözümü için program uygun olmadığında doğrusal ve log-doğusal model karşılaştırması için en küçük kareler yöntemi kullanılabilmektedir.  Karşılaştırmanın yapılabilmesi için Box-Cox dönüşüm testi uygulanabilir. BOX-COX TESTİ

53 (3) (4) En küçük kareler yaklaşımı kullanarak her iki denklemde karşılaştırılabilir. Bunun için orijinal Y gözlemleri geometrik ortalamalarına bölünerek normalleştirilebilmektedir. Normalize edilen Y değişkeni kullanılarak doğrusal ve log- doğrusal model karşılaştırılabilmektedir.

54 BOX-COX TESTİ 1.Adım: Y gözlemlerinin geometrik ortalaması alınır. 2.Adım: Y gözlemleri geometrik ortalamalarına bölünerek Y * değişkenine dönüştürülür. (3) (4)

55 BOX-COX TESTİ 3.Adım: (3) ve (4) nolu modellerde bağımlı değişken yerine Y * değişkeni konur. (3) (4) (5) (6)

56 BOX-COX TESTİ (5) (6) 4.Adım: (5) ve (6) nolu modellerden elde edilen hata kareler toplamına göre ki-kare kritik değeri elde edilir. Serbestlik derecesi 1 olan ki-kare tablo değeri ile karşılaştırılır. Sonuç olarak eğer test değeri tablo değerinden büyük ise daha küçük hata kareler toplamına sahip modelin daha iyi olduğu ifade edilebilir.

57 BOX-COX TESTİ Örnek: 1985:1-1994:2 dönemleri arasında tüketim, gelir ve tüketici fiyat indeksi verileri verilmiştir. İki türlü tüketim fonksiyonu tanımlanmıştır. C t : reel tüketim, Y t : reel gelir Her iki modeli karşılaştırabilmek için reel hale getirilen değişkenlerin logaritması alınarak dönüştürme adımlarına başlanabilir.

58 BOX-COX TESTİ C değişkenin geometrik ortalaması alınır. C * değişkeni (3) ve (4) nolu modellerde bağımlı değişken yerine kullanılır ve (5) ve (6) nolu modeller ayrı ayrı tahminlenir: (5) (6) λ=0 olduğu için logaritmik C değişkeni kullanılmıştır.

59 (5) nolu model: Dependent Variable: C * Method: Least Squares Sample: 1985Q1 1994Q2 Included observations: 38 VariableCoefficientStd. Errort-StatisticProb. Y C R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)

60 (6) nolu model. Dependent Variable: lnC * Method: Least Squares Sample: 1985Q1 1994Q2 Included observations: 38 VariableCoefficientStd. Errort-StatisticProb. C Y R-squared Mean dependent var9.79E-16 Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)

61 Model karşılaştırması Logaritmik fonksiyonun doğrusa l modelden daha iyi olduğu s ö ylenemez H 0 : Model tahminleri arasında fark yoktur. H 1 : Hata kareler toplamı küçük olan model daha iyidir.

62 9 BOX-COX TESTİ ÖRNEK 2 Aşağıdaki iki model karşılaştırılmak istensin. Bir önceki örnekte olduğu gibi bağımlı değişkenin geometrik ortalaması alınarak bağımlı değişken gözlemleri geometrik ortalamaya bölünür.

63 10 BOX-COX TESTİ Kazanç denklemini doğrusal ve yarı logaritmik biçimde karşılaştırmak için yukarıdaki testi uygulayacağız. EARN * elde edildikten sonra aşağıdaki iki model tahminlenebilir. Karşılaştırma amaçlı aşağıdaki test istatistiği hesaplanır. λ≠0 olduğu için bağımlı değişkenin logaritması alınarak iki model elde edilmiştir.

64 . reg EARNSTAR S Source | SS df MS Number of obs = F( 1, 568) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EARNSTAR | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | _cons | EARNSTAR’nın S ye göre regresyonu alınır. Hata kareleri toplamı bulunur. BOX-COX TESTİ

65 . reg LGEARNST S Source | SS df MS Number of obs = F( 1, 568) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = LGEARNST | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | _cons | LGEARNST’nın de regresyonu alınır ve hata kareler toplamı alınır. BOX-COX TESTİ

66 19 Test istatistiği dir. Kikare tablo değeriyle karşılaştırıldığında yarı logaritmik modelin daha iyi olduğuna karar verilir. BOX-COX TESTİ H 0 : Model tahminleri arasında fark yoktur. H 1 : Hata kareler toplamı küçük model daha iyidir.


"Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü. Do ğ rusal Model DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU* 1 Doğrusal olmama durumunu anlatmadan önce doğrusallıktan." indir ppt

Benzer bir sunumlar


Google Reklamları