Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü

Benzer bir sunumlar


... konulu sunumlar: "Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü"— Sunum transkripti:

1 Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü

2 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU*
Doğrusal Model Doğrusal olmama durumunu anlatmadan önce doğrusallıktan bahsetmek gerekmektedir. *Bu konu Christopher Dougherty’, Inroduction to Econometrics kitabının slaytlarından çevrilerek hazırlanmıştır. 1

3 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Yukarıda verilen model iki durum bakımından dorusaldır. Model değişkenler bakımından doğrusaldır. Ayrıca parametreler bakımından da doğrusaldır. 2

4 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Değişkenlerde ve parametrelerde doğrusallık durumu: Parametreler her bir terimde çarpımsal olarak yer almaktadır. 3

5 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Değişken ve parametre bakımından doğrusallık: Parametre bakımından doğrusal, değişken bakımından doğrusal olmama: İkinci model parametre bakımından doğrusalken, değişken bakımından doğrusal değildir. 4

6 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Bu modellerde bir sorun yoktur. Yeni değişkenler yukarıdaki gibi tanımlanabilir. 5

7 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Değişkenlerde ve parametrelerde doğrusallık durumu: Parametrelerde doğrusal değişkenlerde doğrusal olmama durumu: Yapılan yüzeysel dönüşümler ile hem parametre hem de değişkenler doğrusal duruma getirilir. 6

8 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Değişkenlerde ve parametrelerde doğrusallık durumu: Parametrelerde doğrusal değişkenlerde doğrusal olmama durumu: Parametre bakımından doğrusal olmama durumu: Üçüncü model katsayı bakımından doğrusal değildir. X4 değişkeninin katsayısı, X2 ve X3 değişkenleri katsayılarının çarpımıdır. Parametre bakımından doğrusal olmayan modeller uygun dönüşümler sayesinde doğrusallaştırılabilir. 7

9 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Muz Gelir (lbs) ($10,000) Hanehalkı Y X Doğrusallaştırma için yukarıdaki örnek ile başlayalım. 10 hanehalkına ait yıllık muz tüketimi ve yıllık gelir bilgileri yukarıdaki gibidir. 8

10 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Y X Verilerin dağılımı grafikte verilmiştir. 9

11 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
. reg Y X Source | SS df MS Number of obs = F( 1, 8) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = Y | Coef. Std. Err t P>|t| [95% Conf. Interval] X | _cons | Doğrusal modelin sonuçları çıktı olarak verilmiştir. Dağılma diyagramından görüldüğü gibi X’in katsayısı istatistiksel olarak anlamlıdır. R2 değeri oldukça iyidir. 10

12 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Y X Regresyon doğrusu çizildikten sonra dağılım diyagramı yukarıda yine verilmiştir. 11

13 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Y X Grafiğe tahmin değerleri ve hata terimleri eklenmiştir. Hata terimleri modelin bazı bakımlardan yanlış belirlenmiş olabileceğini göstermektedir. 12

14 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Y X Eğer model doğru olarak belirlenmiş olsaydı hata terimleri tesadüfi olarak dağılacaktı. Bu durumda tesadüfi değildir. Negatif hata terimini altı tane pozitif hata terimi ve bunları da üç tane negatif hata terimi takip etmektedir. 13

15 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Yeniden düzenlenmiş model: Y değişkeninin ilişkisinin 1/X ile daha uygun olabilir. Eğer 2 < 0 ise, Y değişkeni X ile yine artacaktır, fakat artış oranı düşecektir. 14

16 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Gözden geçirilmiş model : Yukarıdaki model doğusal değildir. X değişkeninin tersi olarak bir Z değişkeni tanımlanırsa model doğrusal olabilecektir. 15

17 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Muz Gelir (lbs) ($10,000) Hanehalkı Y X Z=1/X Yeni adım Z değişkenini X değişkeni yardımı ile hesaplamaktır. Böylece eski değişkenlerden yeni değişkenler elde edilebilir. 16

18 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Y Z Bu kez Y ve Z arasındaki dağılma diyagramı yukarıdaki gibidir. 17

19 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
. g Z=1/X . reg Y Z Source | SS df MS Number of obs = F( 1, 8) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = Y | Coef. Std. Err t P>|t| [95% Conf. Interval] Z | _cons | Yeni Z değişkeni ile elde edilen model çıktısı yukarıdadır. 18

20 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
. g Z=1/X . reg Y Z Source | SS df MS Number of obs = F( 1, 8) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = Y | Coef. Std. Err t P>|t| [95% Conf. Interval] Z | _cons | Regresyon modeli 19

21 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Y Z Regresyon doğrusu ve verilerin dağılım diyagramı 20

22 DOĞRUSALLIK VE DOĞRUSAL OLMAMA DURUMU
Y X X değişkeninin tersini alarak Z değişkeninin yer alması ve elde edilen modelin orijinal veriler ile grafiği çizildiğinde daha uygun olduğu görülmektedir. 21

23 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Doğrusal olmayan regresyon modellerinin hata yapısını ele alalım. 1

24 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Doğrusal modellerde regresyon sonuçları istenilen özelliklere sahiptir. Dönüştürülen modelde hata terimi toplamsal olmalıdır ve Gauss-Markov şartlarını sağlamalıdır. 2

25 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Geleneksel testlerin gerçekleştirilebilmesi için, dönüştürülmüş model hata terimi normal dağılmalıdır. 3

26 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Eğer orijinal modeldeki hata terimleri istenilen özelliklere sahip ise, doğrusal olmayan regresyon modelindeki hata terimleri de istenilen özelliklere sahiptir. Dönüşümden etkilenmemektedir. 4

27 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Log-log bir modelde hata terimi dışlansın. 5

28 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Bununla birlikte, dönüştürülmüş modelde hata teriminin toplamsal olduğu varsayılsın. 6

29 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Ancak orjinal modelde tesadüfi bileşen çarpımsaldır. eu. 7

30 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Orijinal modeldeki çarpımsal terimi v ile gösterelim. 8

31 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
u sıfıra eşit olduğunda, log Y değerini değiştirmeye gerek yoktur. Aynı biçimde v 1’e eşit olduğunda ise Y değerini değiştirmeye gerek yoktur. 9

32 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
1 değerinden büyük olan v değerlerine karşılık gelen pozitif u değerleri, tesadüfi faktör Y ve log Y üzerinde pozitif etkiye sahiptir. 0 ve 1 değerleri arasındaki v değerlerine karşılık gelen negatif u değerleri, tesadüfi faktör Y ve log Y üzerinde negatif etkiye sahiptir. 10

33 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
f(v) v Ayrıca Gauss-Markov şartlarını sağlanması, t ve F testlerini gerçekleştirebilmek için u teriminin normal dağılması gerekmektedir. 11

34 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
f(v) v Eğer v lognormal dağılıma sahip ise şekli yukarıdaki gibi olacaktır. 12

35 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
f(v) v u = 0 iken, dağılımın modu v =1 olmaktadır. 13

36 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
f(v) v Aynı çarpımsal hata terimi yarı-logaritmik modelde de olmalıdır. 14

37 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
f(v) v Bu dağılımda büyük pozitif tesadüfi etkiye maruz kalan gözlemlerde küçük oransal değişme beklenecektir. 15

38 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Örnekte kazanç ve eğitim yılına ait verilerin dağılımı yukarıdaki gibidir. Birçok aykırı gözlem bulunmaktadır ve bunların üç tanesi sarı ile gösterilmiştir. 16

39 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Yukarıda yarı-logaritmik modelin regresyon doğrusu etrafındaki dağılma diyagramı gösterilmektedir. Aynı üç değer hala aykırı gözlem olarak görülmektedir. 17

40 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Yukarıdaki histogram doğrusal ve yarı-logaritmik modellerin hata terimlerini karşılaştırmaktadır. Hata terimleri standart sapması bir olacak şekilde standartlaştırıldığında karşılaştırılabilir. 18

41 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Eğer regresyon modelindeki hata terimi normal dağılıyorsa yukarıdaki gibi gösterilir 19

42 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Yarı-logaritmik modelden elde edilen hata terimleri yaklaşık olarak normal iken; doğusal modelden elde edilen model hata terimleri normal değildir. Bu da yarı-logaritmik modelin daha iyi tanımlama olduğunu göstermektedir. 20

43 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Eğer tam logaritmik yada yarı-logaritmik model hata terimi çarpımsal yerine toplamsal olursa ne olur? 21

44 DOĞRUSAL OLMAYAN MODELLERDE HATA TERİMİ
Eğer böyle bir durum söz konusu ise, verilerin logaritması alınarak doğrusallaştırılamaz. log(b1Xb + u)’i basitleştirmenin bir yolu yoktur. Bu durum için bazı doğrusal olmayan tekniklerin kullanılması gerekmektedir. 2 22

45 BOX-COX TESTİ* Bir regresyon modelinin tanımlanmasında bağımlı değişken aynı iken R2, modelleri karşılaştırmak için kulllanılabilir. * Bu konu Applied Econoemtrics A Modern Approach” Dimitrios Asterious and Stephen G. Hall, Basic Econometrics, Damodar Guharati ve Econometrics Models and Economic Forecasting, Pindcyk ve Rubinfield kitaplarından alınmıştır. 1

46 Ancak bağımlı değişken aynı değilse karşılaştırma yapılamaz.
BOX-COX TESTİ Ancak bağımlı değişken aynı değilse karşılaştırma yapılamaz. 2

47 BOX-COX TESTİ Bu modeller aynı değildir ve karşılaştırma yapılamaz. Farklı fonksiyonel biçimlerin Box-Cox dönüşümü ile karşılaştırılması mümkündür. 4

48 BOX-COX TESTİ Box-Cox dönüşümü yapılmadan önce Box-Cox dönüşüm parametresi olan λ nın bulunması gerekmektedir. λ belirlendikten sonra bağlım değişkene ilişkin dönüşüm aşağıdaki gibi yapılmaktadır. λ değeri eğer sıfır olarak bulunmuş ise, gerçek bağımlı değişken(Y) ile logaritmik bağımlı değişken (logY) birbiri yerine kullanılabilmektedir. λ nın sıfırdan farklı olması durumunda yukarıdaki formülden hesaplanan yeni bağımlı değişkeni oluşturulup Box-Cox testi aşamaları gerçekleştirilebilir.

49 BOX-COX TESTİ negatif, pozitif ya da sıfır olabilmektedir. (1) nolu eşitlik Box-Cox regresyon modeli olarak adlandırılmaktadır.  aldığı değerlere göre Tablodaki modeller elde edilmektedir. Değeri Regresyon Modeli 1 2 0.5 -0.5 -1.0 Doğrusal ve logaritmik-doğrusal modeller Box-Cox dönüşümünün özel durumlarıdır.

50 BOX-COX TESTİ denkleminde yerine konursa olmaktadır. olmaktadır.

51 BOX-COX TESTİ  = 0 olduğu zaman (Y - 1) / belirsiz olmaktadır. Taylor serisi açılımı kullanılarak Y aşağıdaki gibi ifade edilebilir:

52 BOX-COX TESTİ En çok olabilirlik fonksiyonu ile parametre tahminleri yapılabilmesi için logaritmik olabilirlik fonksiyonu: (2) nolu olabilirlik fonksiyonu  = 0 ve  =1 olduğunda verilere en uygun olan modelin seçimde ve karşılaştırılmasında kullanılabilmektedir. En çok olabilirlik çözümü için program uygun olmadığında doğrusal ve log-doğusal model karşılaştırması için en küçük kareler yöntemi kullanılabilmektedir. Karşılaştırmanın yapılabilmesi için Box-Cox dönüşüm testi uygulanabilir.

53 BOX-COX TESTİ (3) (4) En küçük kareler yaklaşımı kullanarak her iki denklemde karşılaştırılabilir. Bunun için orijinal Y gözlemleri geometrik ortalamalarına bölünerek normalleştirilebilmektedir. Normalize edilen Y değişkeni kullanılarak doğrusal ve log-doğrusal model karşılaştırılabilmektedir.

54 BOX-COX TESTİ (3) (4) 1.Adım: Y gözlemlerinin geometrik ortalaması alınır. 2.Adım: Y gözlemleri geometrik ortalamalarına bölünerek Y* değişkenine dönüştürülür.

55 (3) (4) (5) (6) BOX-COX TESTİ
3.Adım: (3) ve (4) nolu modellerde bağımlı değişken yerine Y* değişkeni konur. (5) (6)

56 BOX-COX TESTİ 4.Adım: (5) ve (6) nolu modellerden elde edilen hata kareler toplamına göre ki-kare kritik değeri elde edilir. Serbestlik derecesi 1 olan ki-kare tablo değeri ile karşılaştırılır. (5) (6) Sonuç olarak eğer test değeri tablo değerinden büyük ise daha küçük hata kareler toplamına sahip modelin daha iyi olduğu ifade edilebilir.

57 BOX-COX TESTİ Örnek: 1985:1-1994:2 dönemleri arasında tüketim, gelir ve tüketici fiyat indeksi verileri verilmiştir. İki türlü tüketim fonksiyonu tanımlanmıştır. Ct : reel tüketim, Yt: reel gelir Her iki modeli karşılaştırabilmek için reel hale getirilen değişkenlerin logaritması alınarak dönüştürme adımlarına başlanabilir.

58 (5) (6) BOX-COX TESTİ C değişkenin geometrik ortalaması alınır.
λ=0 olduğu için logaritmik C değişkeni kullanılmıştır. C* değişkeni (3) ve (4) nolu modellerde bağımlı değişken yerine kullanılır ve (5) ve (6) nolu modeller ayrı ayrı tahminlenir: (5) (6)

59 (5) nolu model: Dependent Variable: C* Method: Least Squares
Sample: 1985Q1 1994Q2 Included observations: 38 Variable Coefficient Std. Error t-Statistic Prob.   Y 0.0000 C 0.0159 R-squared     Mean dependent var Adjusted R-squared     S.D. dependent var S.E. of regression     Akaike info criterion Sum squared resid     Schwarz criterion Log likelihood     F-statistic Durbin-Watson stat     Prob(F-statistic)

60 (6) nolu model. Dependent Variable: lnC* Method: Least Squares
Sample: 1985Q1 1994Q2 Included observations: 38 Variable Coefficient Std. Error t-Statistic Prob.   C 0.0000 Y R-squared     Mean dependent var 9.79E-16 Adjusted R-squared     S.D. dependent var S.E. of regression     Akaike info criterion Sum squared resid     Schwarz criterion Log likelihood     F-statistic Durbin-Watson stat     Prob(F-statistic)

61 Model karşılaştırması
H0: Model tahminleri arasında fark yoktur. H1: Hata kareler toplamı küçük olan model daha iyidir. Logaritmik fonksiyonun doğrusal modelden daha iyi olduğu söylenemez

62 Aşağıdaki iki model karşılaştırılmak istensin.
BOX-COX TESTİ ÖRNEK 2 Aşağıdaki iki model karşılaştırılmak istensin. Bir önceki örnekte olduğu gibi bağımlı değişkenin geometrik ortalaması alınarak bağımlı değişken gözlemleri geometrik ortalamaya bölünür. 9

63 EARN* elde edildikten sonra aşağıdaki iki model tahminlenebilir.
BOX-COX TESTİ EARN* elde edildikten sonra aşağıdaki iki model tahminlenebilir. Karşılaştırma amaçlı aşağıdaki test istatistiği hesaplanır. λ≠0 olduğu için bağımlı değişkenin logaritması alınarak iki model elde edilmiştir. Kazanç denklemini doğrusal ve yarı logaritmik biçimde karşılaştırmak için yukarıdaki testi uygulayacağız. 10

64 BOX-COX TESTİ . reg EARNSTAR S Source | SS df MS Number of obs = F( 1, 568) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EARNSTAR | Coef. Std. Err t P>|t| [95% Conf. Interval] S | _cons | EARNSTAR’nın S ye göre regresyonu alınır. Hata kareleri toplamı bulunur. 17

65 LGEARNST’nın de regresyonu alınır ve hata kareler toplamı alınır.
BOX-COX TESTİ . reg LGEARNST S Source | SS df MS Number of obs = F( 1, 568) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = LGEARNST | Coef. Std. Err t P>|t| [95% Conf. Interval] S | _cons | LGEARNST’nın de regresyonu alınır ve hata kareler toplamı alınır. 18

66 H0: Model tahminleri arasında fark yoktur.
BOX-COX TESTİ H0: Model tahminleri arasında fark yoktur. H1: Hata kareler toplamı küçük model daha iyidir. Test istatistiği dir. Kikare tablo değeriyle karşılaştırıldığında yarı logaritmik modelin daha iyi olduğuna karar verilir. 19


"Doğrusal Olmayan Modeller ve Box-Cox Dönüşümü" indir ppt

Benzer bir sunumlar


Google Reklamları