Sunuyu indir
Sunum yükleniyor. Lütfen bekleyiniz
1
Mehmet Vedat PAZARLIOĞLU
KUKLA DEĞİŞKENLER Mehmet Vedat PAZARLIOĞLU
2
Kukla Değişken Nedir? Cinsiyet, eğitim seviyesi, meslek, din, ırk, bölge, tabiiyet, savaşlar, grevler, siyasi karışıklıklar (=darbeler), iktisat politikasındaki değişiklikler, depremler, yangın ve benzeri nitel değişkenlerin ekonometrik bir modelde ifade edilme şeklidir.
3
Kukla Değişkenlerin Modelde Kullanımı
Kukla Değişken/lerin Modelde bağımsız değişken olarak yer alması Kukla Değişkenin Modelde Bağımlı Değişken olarak yer alması
4
Bağımsız Kukla Değişkenler
Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin ve Sayısal değişkenlerin Birlikte yer aldığı Modeller (Kovaryans Analizi Modeller) Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler Parçalı Doğrusal Regresyon
5
Bir kukla değişkenli modeller
Yi = a + b Di +ui Yi = Öğretim Üyelerinin Yıllık Maaşları Di = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Varyans Analiz Modelleri (ANOVA) Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Yi|Di = 0 ) = a Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Yi|Di = 1) = a + b
6
Bir kukla değişkenli modeller
Maaş Cinsiyet 22 1 19 18 21.7 18.5 21 20.5 17 17.5 21.2 Yi = Di (0.32) (0.44) t (57.74)(7.44) , R2=0.8737
7
Bir kukla değişkenli modeller
Yi = Di (0.32) (0.44) t (57.74)(7.44) , R2=0.8737 Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Yi|Di = 0 ) = 18 Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Yi|Di = 1) = = 21.28 Erkek ve Kadın Öğretim Üyelerinin Ortalama Maaş Farkı : 3.28
8
Bir kukla değişkenli modeller
3.28 21.28 18.00 1 Yi = Di (0.32) (0.44) t (57.74)(7.44) , R2=0.8737
9
Kukla değişken ve Sayısal Değişkenli Model
Yi = a1 + a2 Di + b Xi + ui Yi = Öğretim Üyelerinin Yıllık Maaşları Xi = Öğretim Üyesinin Yıl olarak Tecrübesi Di = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Kadın Öğretim Üyelerinin Ortalama Maaşları : E( Yi|Xi,Di = 0 ) = a1+bXi Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Yi|Xi,Di = 1) = (a1 + a2 )+bXi
10
Kukla değişken ve Sayısal Değişkenli Model
Maaş Cinsiyet Tecrübe 22 1 16 19 12 18 21.7 15 18.5 10 21 11 20.5 13 17 8 17.5 9 21.2 14 Yi = Di Xi s(b) (0.95) (0.44) (0.09) (t) (15.843) (5.088) (3.211) p (0.000) (0.002) (0.020) R2=0.949
11
Kukla değişken ve Sayısal Değişkenli Model
Yi = Di Xi (t) (15.843) (5.088) (3.211) p (0.000) (0.002) (0.020) Kadın Öğretim Üyelerinin Maaş Fonksiyonu: E( Yi|Di = 0 ) = Xi Erkek Öğretim Üyelerinin Maaş Fonksiyonu: E( Yi|Di = 1 ) = Xi = Xi Erkek ve Kadın Öğretim Üyelerinin Ortalama Maaş Farkı : 2.239
12
Kukla değişken ve Sayısal Değişkenli Model
2.239 17.29 15.051 E( Yi|Di = 0 ) = Xi E( Yi|Di = 1 ) = Xi = Xi
13
Birden Fazla Kukla Değişkenli Modeller
Yi= b1 + b2D2 + b3D3 + b4Xi + ui Yi = Sigara Tüketimi D2 = 1 Sigara Tüketen Erkek D3 = 1 Şehirde oturanların sigara tüketimi = 0 Sigara Tüketen Kadın = 0 Kırsalda oturanların sigara tüketimi Xi = Gelir Kırdaki Kadınların Sigara Tüketimi: E( Yi|D2=0,Yi|D3=0) = b1 + b4Xi Kırdaki Erkeklerin Sigara Tüketimi : E (Yi|D2=1,Yi|D3=0) = b1 + b2D2 + b4Xi Kentteki Kadınların Sigara Tüketimi: E( Yi|D2=0,Yi|D3=1 ) = b1 + b3D3 + b4Xi Kentteki Erkeklerin Sigara Tüketimi: E( Yi|D2=1,Yi|D3=1 ) = b1 + b2D2 + b3D3 + b4Xi
14
Birden Fazla Kukla Değişkenli Modeller
Yıllık Sigara Tüketimi Yi (100 TL) Cinsiyet(D3) Şehir(D3) Yıllık Gelir (Xi)(100 TL) 25 1 400 20 260 19 270 24 360 240 22 310 21 280 18 200 320
15
Birden Fazla Kukla Değişkenli Modeller
Yi= b1 + b2D2 + b3D3 + b4Xi + ui Yi = Sigara Tüketimi D2 = 1 Sigara Tüketen Erkek D3 = 1 Şehirde oturanların sigara tüketimi = 0 Sigara Tüketen Kadın = 0 Kırsalda oturanların sigara tüketimi Xi = Gelir Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.0001 D2 0.3662 D3 0.2014 X 0.0017 R-squared F-statistic Adjusted R-squared Prob(F-statistic) S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Durbin-Watson stat Hannan-Quinn criter.
16
1.Sabit Terimlerin Farklı Eğimlerin Eşit olması
Yi= a1 + a2Di + bXi + ui Yi = Sigara Tüketimi Di = 1 Sigara Tüketen Erkek = 0 Xi = Gelir E( Yi|Xi,Di = 0 ) = a1+bXi E ( Yi|Xi,Di = 1) = (a1 + a2 )+bXi
17
Kukla değişken ve Sayısal Değişkenli Model
Yi= a1 + a2Di + b2Xi + ui a2 a1+a2 a1
18
2. Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali
Yi= a1 + b1Di Xi+ b2Xi + ui Yi = Sigara Tüketimi Di = 1 Sigara Tüketen Erkek = 0 Xi = Gelir E( Yi|Xi,Di = 0 ) = a1+b2Xi E ( Yi|Xi,Di = 1) = a1 + (b1+b2)X i
19
2. Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali
Yi= a1 + b1Di Xi+ b2Xi + ui Yi E ( Yi|Xi,Di = 1) = a1 + (b1+b2)X i b1 + b2 ) E( Yi|Xi,Di = 0 ) = a1+b2Xi b2 ) a1 Xi 19
20
3. Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması
Yi= a1 + a2 Di+ b1Di Xi+ b2Xi + ui Yi = Sigara Tüketimi Di = 1 Sigara Tüketen Erkek = 0 Xi = Gelir E( Yi|Xi,Di = 0 ) = a1+b2Xi E ( Yi|Xi,Di = 1) = (a1+a1 ) + (b1+b2)X i
21
3. Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması
Yi= a1 + a2 Di+ b1Di Xi+ b2Xi + ui Yi E ( Yi|Xi,Di = 1) = (a1+a1 ) + (b1+b2)X i E( Yi|Xi,Di = 0 ) = a1+b2Xi a1+a2 a1 b2 b1+b2 ) ) Xi 21
22
Modelin t İstatistiklerinin Değerlendirilmesi
Yi= a1 + a2 Di+ b1Di Xi+ b2Xi + ui a2 ve b1’ün t istatistikleri anlamsızsa iki sınıf sigara tüketim fonksiyonları aynı 2.a2 ve b1’ün t istatistikleri anlamlıysa iki sınıf sigara tüketim fonksiyonları farklı (3.durum) a2 ve b1’ün t istatistiklerinden a2 anlamsız ve b1 anlamlıysa sabit terim aynı eğim farklıdır. (2. durum) 4. a2 ve b1’ün t istatistiklerinden a2 anlamlı ve b1 anlamsızsa sabit terim farklı eğim aynıdır. (1. durum)
23
Yıllık Sigara Tüketimi Cinsiyet (Di) (Erkek = 1, Kadın = 0)
İki Sınıf Modellerinin Farklılığının Kukla Değişken Yöntemi İle Testi Yıllık Sigara Tüketimi Cinsiyet (Di) (Erkek = 1, Kadın = 0) Yıllık Gelir (Xi) 25 1 400 20 260 19 270 24 360 240 22 310 21 280 18 200 320 Yi= a1 + a2 Di+ b1Di Xi+ b2Xi + ui 23
24
Yi= a1 + a2 Di+ b1Di Xi+ b2Xi + ui
İki Sınıf Modellerinin Farklılığının Kukla Değişken Yöntemi İle Testi Yi= a1 + a2 Di+ b1Di Xi+ b2Xi + ui Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.0012 D2 0.3016 D2*X 0.2017 X 0.1507 R-squared F-statistic Adjusted R-squared Prob(F-statistic) S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Durbin-Watson stat Hannan-Quinn criter. Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.0000 X R-squared F-statistic Adjusted R-squared Prob(F-statistic) S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Durbin-Watson stat Hannan-Quinn criter. 24
25
2. CHOW testi ile tüketim fonksiyonlarının farklılığının araştırılması
Üç grup tüketim fonksiyonu tahmin edilir: H0: Erkek ve kadınlar için tüketim fonk. aynıdır. H1: Erkek ve kadınlar için tüketim fonk. farklıdır. Erkek-kadın tüm tüketiciler için tüketim fonksiyonu: HKT=3.162 Erkekler için tüketim fonksiyonu: HKT=0.2018 Kadınlar için tüketim fonksiyonu: HKT=1.865 Ftest = Ftab= 5.14 (a= f1= f2=6 sd. lerinde) H0 kabul
26
Birden Fazla Kukla Değişkenli Modeller
Yıllık Sigara Tüketimi Yi (100 TL) Cinsiyet(D3) Şehir(D3) Yıllık Gelir (Xi)(100 TL) 25 1 400 20 260 19 270 24 360 240 22 310 21 280 18 200 320
27
Birden Fazla Kukla Değişkenli Modeller
Yi= b1 + b2D2 + b3D3 + b4Xi + ui Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.0001 D2 0.3662 D3 0.2014 X 0.0017 R-squared F-statistic Adjusted R-squared Prob(F-statistic) S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Durbin-Watson stat Hannan-Quinn criter. Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.0000 D3 0.1013 X 0.0001 R-squared F-statistic Adjusted R-squared Prob(F-statistic) S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Durbin-Watson stat Hannan-Quinn criter.
28
BİR MODELDE KUKLA DEĞİŞKENLERİN KARŞILIKLI OLARAK BİRBİRİNİ ETKİLEMELERİ PROBLEMİ
Şehirde Oturan bir Erkeğin Tüketim Farkı Erkeğin Tüketim Farkı Şehirde Oturanların Tüketim Farkı 28
29
Birden Fazla Kukla Değişkenli Modeller
Yi= b1 + b2D2 + b3D3 + b4D2D3 + b5Xi + ui Yi= b1 + b5Xi Yi= b1 + b2D2 + b5Xi Yi= b1 + b3D3 + b5Xi Yi= b1 + b2D2 + b3D3 + b4D2D3 + b5Xi Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.0004 D2 0.187 D3 0.1066 D2*D3 0.2597 X 0.0307 0.0022 R-squared F-statistic Adjusted R-squared Prob(F-statistic) S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Durbin-Watson stat Hannan-Quinn criter.
30
Üçer Aylar Karlar (Milyon Dolar) Satışlar 1965-I 10503 114862 II 12092
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Üçer Aylar Karlar (Milyon Dolar) Satışlar 1965-I 10503 114862 II 12092 123968 III 10834 121454 IV 12201 131917 1966-I 12245 129911 14001 140976 12213 137828 12820 145465 D2 1 D3 1 D4 1 30
31
Dependent Variable: Kar
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Dependent Variable: Kar Variable Coefficient Std. Error t-Statistic Prob. C D D D Satış R2= İstatistiki olarak anlamsız 31
32
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA
Dependent Variable: Kar Sample: 1965:1 1970:4 VariableCoefficient Std. Error t-Statistic Prob. C D Satış R2 = Mevsim dalgalanmalarının etkisinde 32
33
Parçalı Doğrusal Regresyon
Bir sigorta şirketi satış temsilcilerinin belli bir satış hacmini geçmesi durumunda çalışanlarına komisyon ödemektedir. Şirket içerisinde gerçekleştirilen satış komisyon ücretleri belli bir satış hacmi(X*) eşik düzeyine kadar doğrusal artmakta ve bu eşik düzeyinden sonra ise daha dik bir oranla satışlarla doğrusal olarak arttığı varsayılmaktadır. Bu durumda I ve II olarak numaralandırılmış iki parçadan oluşan parçalı doğrusal regresyona ve eşik düzeyinde eğimin değiştiği komisyon fonksiyonuna sahip olmuş oluruz. • II Satış Komisyonları I X* X 33
34
Parçalı Doğrusal Regresyon
Satış Komisyonları Y X Satışlar • Yi= a1 + b1Xi + b2 (Xi-X*)Di+ui Yi= Satış Komisyonları Xi= Satış Miktarı X*= Satışlarda Prim Eşik Değeri D= 1 Eğer Xi > X* = 0 Eğer Xi < X* X* E(Yi| Di =0,Xi, X*) = a1 +b1 Xi E(Yi| Di =1,Xi, X*) = a1 - b2X* +(b1+ b2)Xi
35
Parçalı Doğrusal Regresyon
Satış Komisyonları Y X Satışlar b1+b2 1 b1 1 a1 X* a1-b2X*
36
Örnek Bir şirket satış temsilcilerinin belli bir satış hacmini geçmesi durumunda çalışanlarına prim ödemektedir. Dependent Variable: TC Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C Q (Q-5500)*DI R2= F-statistic= [ ] Total Cost($) TC Output(units) Q Di 256 1000 414 2000 634 3000 778 4000 1003 5000 1839 6000 1 2081 7000 2423 8000 2734 9000 2914 10000 Satışlardaki artışlar prim değerini arttırmamaktadır. İstatistiki olarak anlamsız H0: Satışlardaki artışlar prim değerini arttırmamaktadır. H1: Satışlardaki artışlar prim değerini arttırmaktadır.
37
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
UYGULAMA: yıllarına arasında General Motor, Westinghouse ve General Electric firmalarına ait yatırım (Y), firmanın değeri (X2 ) ve sermaye stoğu (X3) verilerine ait tablo aşağıda verilmiştir. 37
38
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
Firmaların yatırımları arasında fark olup olmadığını inceleyebilmek için de kukla değişkenlerden yararlanabiliriz. Firmaların ilk üç yılına ait veriler ile oluşturulan yeni tablo aşağıdaki gibidir. Yıllar Y X2 X3 Di Firma 1935 317.6 3078.5 2.8 1 GM 1936 391.8 4661.7 52.6 1937 410.6 5387.1 156.9 12.93 191.5 1.8 WE 25.90 516.0 0.8 35.05 729.0 7.4 33.1 1170.6 97.8 GE 45.0 2015.8 104.4 77.2 2803.3 118.0 General Motor(GM), Westinghouse(WE) ve General Electric (GE) yatırım (Y), firmanın değeri (X2 ) ve sermaye stoğu (X3) 38
39
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
GM yatırımlarının diğer firma yatırımlarından sabit terim kadar farklı olduğunu ifade etmektedir.
40
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
Dependent Variable: Y Method: Least Squares Included observations: 60 Variable Coefficient Std. Error t-Statistic Prob. C X X DI R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) İstatistiksel olarak anlamlı 40
41
ÖRNEKLER 41
42
DATA7-19 1960-1988 yılları arasında Türkiye’deki Sigara Tüketimi
Q Yetişkinlerin sigara tüketim miktarı(kg), Range Y GNP(1968) TL, Range P Türkiye’deki sigara fiyatları Range ED1 Kayıtlı ortaokul ve lise mezunu nüfus oranı(12-17 yaş) Range ED2 Kayıtlı üniversite mezunu oranı (20-24) Range D82 = 1 , 1982 ve sonrası D86 = 1 , ve sonrası 42
43
Included observations: 29
Dependent Variable: Q Sample: Included observations: 29 Variable Coefficient Std. Error t-Statistic Prob. P ED ED D D Y C Katsayılar istatistiksel olarak anlamsız 43
44
Included observations: 29
Dependent Variable: Q Method: Least Squares Sample: Included observations: 29 Variable Coefficient Std. Error t-Statistic Prob. ED D D Y C 44
45
DATA7-2 Belirli bir şirkette çalışan 49 kişinin istihdam durumu ve ücretleri WAGE = Aylık Ücret (Range ) EDUC = 8 yıllık eğitimden sonraki sahip olunan eğitim seviyesi(Range ) EXPER =Şirkette çalışma süresi(Range ) AGE = Yaş ( ) GENDER = 1, Erkek ise; 0 kadın ise RACE = 1, beyaz ise; 0 diğerleri CLERICAL = 1 büro memuru ise, 0 diğerleri MAINT = 1 bakım işlerinde çalışıyor ise; 0 diğerleri CRAFTS =1,usta ise; 0 diğerleri Temel sınıf Profesyonel meslek grupları. 45
46
Dependent Variable: WAGE Method: Least Squares
Included observations: 49 Variable Coefficient Std. Error t-Statistic Prob. C EDUC EXPER GENDER RACE CLERICAL MAINT CRAFTS R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) 46
47
DATA 7-9 colgpa = 1986 sonbaharındaki ortalamaları (Range 0.85 - 3.97)
1985 yılında koleje giriş yapan öğrencilerin ilk yıl başarılarını göstermekte colgpa = sonbaharındaki ortalamaları (Range ) hsgpa = Lise GPA (Range ) vsat = Sözel derecesi (Range ) msat = Sayısal derecesi (Range ) dsci = 1 Bilim dalı için, 0 diğerleri dsoc = 1 Sosyal bilim dallı için, 0 diğerleri dhum = 1 Beşeri bilimdalı için 0 diğerleri darts = 1 Sanat dalı için, 0 diğerleri dcam = 1 Öğrenci kampüste yaşıyorsa, 0 diğerleri dpub = 1 Genel lise mezunu ise, 0 diğerleri 47
48
Dependent Variable: COLGPA Method: Least Squares Sample: 1 427
Included observations: 427 Variable Coefficient Std. Error t-Statistic Prob. C HSGPA VSAT MSAT DSCI DSOC DHUM DARTS DCAM DPUB Katsayılar istatistiki olarak anlamsız 48
49
Dependent Variable: COLGPA
Variable Coefficient Std. Error t-Statistic Prob. C HSGPA VSAT MSAT 49
50
Bağımlı Kukla Değişkenler
Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla değişkenler söz konusudur. Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır: -Doğrusal Olasılık Modeli -Logit Modeli -Probit Modeli -Tobit Modeli
51
Doğrusal Olasılık Modeli
Yi = b1 + b2Xi +ui Yi= 1 Eğer i. Birey istenen özelliğe sahipse 0 Diğer Durumlarda Xi= Bağımsız değişken Bu modele olasılıklı model denmesinin nedeni, Y’nin X için şartlı beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır. E(Yi|Xi)= Pr(Yi=1| Xi)
52
Doğrusal Olasılık Modeli
Yi = b1 + b2Xi +ui E(ui) = 0 E(Yi |Xi)= b1 + b2Xi Yi değişkeninin olasılık dağılımı: Yi Olasılık 1-Pi 1 Pi Toplam E(Yi |Xi) = SYiPi = 0.(1-Pi) + 1.(Pi) = Pi E(Yi |Xi)= b1 + b2Xi 0 E(Yi |Xi) 1
53
Doğrusal Olasılık Modeli
Di = b1 + b2Medenii +b3 Egitimi +ui Di= 1 Eğer i. Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda Medenii= 1 Eğer i. Kadın evliyse diğer durumlarda 0 Eğitimi = i.kadının yıl olarak aldığı eğitim Yaşi = i. Kadının Yaşı
54
Di Mi Ai Si 1 31 16 35 10 34 14 40 41 43 67 9 37 12 25 27 13 58 28 45 48 55 66 7 44 11 8 21 15 62 23 51 39
55
Kadının İşgücüne Katılımı Modeli
Di = b1 + b2Medenii +b3 Egitimi Dependent Variable: DI Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. C -0.284 0.436 -0.652 0.520 MEDENI -0.382 0.153 -2.494 0.019 EGITIM 0.093 0.035 2.688 0.012 R-squared 0.363 F-statistic 7.708 Adjusted R-squared 0.316 Prob(F-statistic) 0.002 S.E. of regression 0.412 Akaike info criterion 1.159 Sum squared resid 4.583 Schwarz criterion 1.299 Durbin-Watson stat 2.551 Hannan-Quinn criter. 1.204
56
Farklı Varyans Testi Heteroskedasticity Test: Breusch-Pagan-Godfrey
F-statistic Prob. F(2,27) 0.3949 Obs*R-squared Prob. Chi-Square(2) 0.3687 Test Equation: Dependent Variable: RESID^2 Variable Coefficient Std. Error t-Statistic Prob. C 0.063 MEDENI 0.625 EGITIM 0.232 R-squared Mean dependent var 0.153 Adjusted R-squared S.D. dependent var 0.162 S.E. of regression Akaike info criterion -0.708 Sum squared resid Schwarz criterion -0.568 Hannan-Quinn criter. -0.663 Prob(F-statistic) Durbin-Watson stat 2.085
57
Di Tahmin Değerleri Di Di-tah 1 1.204 0.646 0.636 0.822 0.264 0.553
0.264 0.553 0.450 0.832 0.925 1.018 -0.015 0.357 0.460 0.739 1.111 0.543 0.171
58
DOM Tahminindeki Sorunlar
ui hata teriminin normal dağılmaması ui hata teriminin Binom Dağılımlı Olması ui hata teriminin değişen varyanslı olması 0 E(Yi |Xi) 1 varsayımının yerine gelmeyişi
59
ui hata teriminin normal dağılmaması
Normallik varsayımının sağlanmaması durumunda tahmin ediciler sapmasızlıklarını korurlar. Nokta tahminde normallik varsayımı gözardı edilir. Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla normal dağılıma uyarlar. DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı altındaki EKK sürecine uyarlar.
60
ui hata teriminin Binom Dağılımlı Olması
DOM’de u’lar normal dağılmaz, binom dağılımı gösterir: Y ve 0 değerini aldığında Yi =1 için Yi =0 için u’lar normal değildir. İki değerli binom dağılımlıdır. Ancak büyük örneklerde DOM güven aralıkları ve hipotez testleri geçerlidir ve EKKY normal dağılım varsayımının sağlandığı kabul edilmektedir.
61
ui hata teriminin değişen varyanslı olması
kesikli bir Y değişkeni varyansından hareketle Y yerine u alınarak Yi ui İhtimal=P(ui) -b1-b2X (1-Pi) 1 1-b1-b2X Pi u’nun varyansı farklıdır. u’nun varyansı Y’nin X için şartlı beklenen değerine bağlıdır ve sonuçta u’nun varyansı X’in değerine bağlı olacak ve eşit olmayacaktır.
62
ui hata teriminin değişen varyanslı olması
Var(ui) = Pi(1-Pi) DOM’nin EKKY ile tahmininde ortaya çıkan farklı varyans problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm getirmek mümkündür: ler bilinmediğinden bunun yerine örnek tahmini değerleri hesaplanarak ifadesinde yerine konarak ler kullanılır.
63
0 E(Yi |Xi) 1 varsayımının yerine gelmeyişi
DOM’de Y’nin şartlı olasılığını gösteren E(Y|X) nın 0 ila 1 arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.Bu şart anakütle için geçerlidir. Anakütlenin tahmincisi için geçerli olmayabilir. Tahmini şartlı olasılıklar 0 ile 1 olmayabilir: 63
64
0 E(Yi |Xi) 1 0 ile 1 arasında mıdır? DOM”, EKKY ile elde edildikten sonra Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için 0 değerini alır. 1’den büyük değerli ise bunlar için nin 1’e eşit olduğu kabul edilir. Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın kalktığı görülebilir. eşit varyanslıdır. Bu yöntem TEKKY’dir.
65
DOM’de Farklı Varyansı Önleme
Dependent Variable: Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)
66
DOM’e Alternatif Model Arama
DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir Ancak, DOM, Pi=E(Y=1|X) olasılığının X’le doğrusal olarak arttığını varsayar. Yani X’deki marjinal veya küçük bir artış hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir. DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir: 1.Xi arttıkça Pi=E(Y=1|X)’de artar ancak 0 ile 1 aralığının dışına çıkmaması gerekmektedir. 2.Pi ile Xi arasındaki ilişkinin doğrusal olmaması gerekmektedir.
67
DOM’e Alternatif Model Arama
Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir: P 1 KDF X - + Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir. Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde kullanılabilir.
68
Logit Model Logistik Dağılım Fonksiyonu
kümülatif lojistik dağılım fonksiyonudur. Bahis yada olabilirlik oranı Bu orana ev sahibi olma lehine fark oranı denir. Lojistik modelin her iki tarafının doğal log. alındığında Li fark oranı logaritması olup hem X, hem parametrelere göre doğrusaldır.Z değişkeni dan a değişirken, P 0 ile 1 arasında değişir.
69
Logit Model Logit modelde olasılık iken. DOM’de şeklindedir.
70
Logit Model Zi, - ile + arasında değerler alırken Pi’nin aldığı değerler ise 0 ile 1 arasında değişmektedir. Zi ile Pi arasındaki ilişki doğrusal değildir.
71
Logit Modelin Özellikleri
1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -ile + arasında değer alır. Pi=1 = + Pi=0 = - 2. Logit, X’e göre doğrusal iken olasılıklara göre değildir. 3. Logit modelin b2 katsayısı şu şekilde yorumlanır: Bağımsız değişkendeki bir birimlik değişme karşısında logitteki değişmeyi gösterir. 4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.
72
Logit Modelin EKKY İle Tahmini
1.Adım: İhtimalleri hesaplanır. 2.Adım: fark oranı logaritmaları hesaplanır. 3.Adım: Orijinal lojistik modeli tahminlenir. Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir.
73
Logit Modelin EKKY İle Tahmini
Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. Dönüşümlü veya Tartılı EKK Lojistik Modeli
74
Logistik Model Uygulaması
300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (Xi) ve ev sahibi olanların sayısı (ni) aşağıdaki tabloda gösterilmiştir. X Milyon TL) Aile Sayısı= Ni Ev Sahibi Olan Aile Sayısı=ni Nispi Frekanslar Pi=ni/Ni 12 20 5 0.25 16 25 6 0.24 35 10 0.28 26 45 15 0.33 30 50 0.50 40 34 18 0.53 0.66 60 0.61 70 0.75 80 0.67 Ni = 300 ni = 140
75
Logistik Model Uygulaması
Xi 1 12 16 20 26 30 40 50 60 70 80 Ni 2 20 25 35 45 50 34 30 26 15 ni 3 5 6 10 15 25 18 20 16 Pi 4=3/2 0.25 0.24 0.28 0.33 0.50 0.53 0.66 0.61 0.75 0.67 1-Pi 5=1-4 0.75 0.76 0.72 0.67 0.50 0.47 0.34 0.39 0.25 0.33 Pi /1- Pi 6=4/5 0.33 0.31 0.39 0.49 1.00 1.13 1.94 1.56 3.00 2.03 Li 7=ln(6) 0.0000 0.1222 0.6626 0.4446 1.0986 0.7080
76
Logistik Model Uygulaması
Dependent Variable: L Method: Least Squares Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C X R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)
77
Logistik Model Uygulaması
v=N.P.(1-P) 8=2.4.5 3.75 4.56 7.05 9.95 12.50 8.47 6.73 6.18 3.31 vi 9= 8 1.9365 2.1354 2.6552 3.1543 3.5355 2.9103 2.5942 2.4859 1.8193 L* 10=7.9 0.0000 0.3556 1.7189 1.1052 2.1274 1.2880 X* 11=1.9
78
Logistik Model Uygulaması
Li*= vi Xi*, s= s(bi): (0.2315) ( ) , R2= 0.80 t= ( ) (6.0424) , d= 1.649, F= 36.95 Gelir bir birim arttığında, ev sahibi olma lehine fark oranının logaritması artmaktadır. Bu fark oranına göre belli bir gelir seviyesinde ev sahibi olma olasılığı hesaplanabilir: X=40 iken değerleri yukarıdaki denklemde yerine konduğunda L*= bulunur. olabilirlik oranı
79
40 birim gelirli bir ailenin ev sahibi olma olasılığı %47.43’dür.
Lojistik modelden, belli bir gelir seviyesinde gelirdeki bir birimlik artışın ev sahibi olma olasılığını ne ölçüde arttıracağı tahmin edilebilir: formülünden yararlanılır. X=40 iken gelir 1 birim arttığında ev sahibi olma olasılığı [ ( )0.4743]= (%0.8)
Benzer bir sunumlar
© 2024 SlidePlayer.biz.tr Inc.
All rights reserved.