Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Mehmet Vedat PAZARLIOĞLU KUKLA DEĞİŞKENLER. Kukla Değişken Nedir? Cinsiyet, eğitim seviyesi, meslek, din, ırk, bölge, tabiiyet, savaşlar, grevler, siyasi.

Benzer bir sunumlar


... konulu sunumlar: "Mehmet Vedat PAZARLIOĞLU KUKLA DEĞİŞKENLER. Kukla Değişken Nedir? Cinsiyet, eğitim seviyesi, meslek, din, ırk, bölge, tabiiyet, savaşlar, grevler, siyasi."— Sunum transkripti:

1 Mehmet Vedat PAZARLIOĞLU KUKLA DEĞİŞKENLER

2 Kukla Değişken Nedir? Cinsiyet, eğitim seviyesi, meslek, din, ırk, bölge, tabiiyet, savaşlar, grevler, siyasi karışıklıklar (=darbeler), iktisat politikasındaki değişiklikler, depremler, yangın ve benzeri nitel değişkenlerin ekonometrik bir modelde ifade edilme şeklidir.

3 Kukla Değişkenlerin Modelde Kullanımı Kukla Değişken/lerin Modelde bağımsız değişken olarak yer alması Kukla Değişkenin Modelde Bağımlı Değişken olarak yer alması

4 Bağımsız Kukla Değişkenler Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin ve Sayısal değişkenlerin Birlikte yer aldığı Modeller (Kovaryans Analizi Modeller) Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler Parçalı Doğrusal Regresyon

5 Bir kukla değişkenli modeller Y i =  +  D i +u i Y i = Öğretim Üyelerinin Yıllık Maaşları D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Varyans Analiz Modelleri (ANOVA) Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Y i |D i = 0 ) =  Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i |D i = 1) =  + 

6 Bir kukla değişkenli modeller MaaşCinsiyet 221 190 180 21.71 18.50 211 20.51 170 17.50 21.21 Y i =  +  D i (0.32)(0.44) t(57.74)(7.44),R 2 =0.8737

7 Bir kukla değişkenli modeller Y i =  +  D i (0.32)(0.44) t(57.74)(7.44),R 2 =0.8737 Kadın Öğretim Üyelerinin Ortalama Maaşları: Erkek Öğretim Üyelerinin Ortalama Maaşları : E( Y i |D i = 0 ) =  E ( Y i |D i = 1) =  +  =  Erkek ve Kadın Öğretim Üyelerinin Ortalama Maaş Farkı : 

8 Bir kukla değişkenli modeller Y i =  +  D i (0.32)(0.44) t(57.74)(7.44),R 2 =0.8737 3.28 18.00 21.28 0 1

9 Kukla değişken ve Sayısal Değişkenli Model Y i =   +   D i +  X i + u i Y i = Öğretim Üyelerinin Yıllık Maaşları X i = Öğretim Üyesinin Yıl olarak Tecrübesi D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Kadın Öğretim Üyelerinin Ortalama Maaşları : E( Y i |X i,D i = 0 ) =    X i Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i |X i,D i = 1) = (   +    X i

10 Kukla değişken ve Sayısal Değişkenli Model MaaşCinsiyetTecrübe 22116 19012 18012 21.7115 18.5010 21111 20.5113 1708 17.509 21.2114 Y i =  +  D i + 0.289 X i s(b)(0.95)(0.44)(0.09) (t)(15.843) (5.088)(3.211) p(0.000)(0.002)(0.020) R 2 =0.949

11 Kukla değişken ve Sayısal Değişkenli Model Kadın Öğretim Üyelerinin Maaş Fonksiyonu: Erkek Öğretim Üyelerinin Maaş Fonksiyonu: E( Y i |D i = 0 ) =  + 0.289 X i Erkek ve Kadın Öğretim Üyelerinin Ortalama Maaş Farkı :  Y i =  +  D i + 0.289 X i (t)(15.843) (5.088)(3.211) p(0.000)(0.002)(0.020) E( Y i |D i = 1 ) =  +  + 0.289 X i =  + 0.289 X i

12 Kukla değişken ve Sayısal Değişkenli Model E( Y i |D i = 0 ) =  + 0.289 X i E( Y i |D i = 1 ) =  +  + 0.289 X i =  + 0.289 X i   

13 Birden Fazla Kukla Değişkenli Modeller Y i = b 1 + b 2 D 2 + b 3 D 3 + b 4 X i + u i Y i = Sigara Tüketimi D 2 = 1 Sigara Tüketen ErkekD 3 = 1 Şehirde oturanların sigara tüketimi = 0 Sigara Tüketen Kadın = 0 Kırsalda oturanların sigara tüketimi X i = Gelir Kırdaki Kadınların Sigara Tüketimi: E( Y i |D 2 =0,Y i |D 3 =0) = b 1 + b 4 X i Kırdaki Erkeklerin Sigara Tüketimi : E (Y i |D 2 =1,Y i |D 3 =0) = b 1 + b 2 D 2 + b 4 X i Kentteki Kadınların Sigara Tüketimi: E( Y i |D 2 =0,Y i |D 3 =1 ) = b 1 + b 3 D 3 + b 4 X i Kentteki Erkeklerin Sigara Tüketimi: E( Y i |D 2 =1,Y i |D 3 =1 ) = b 1 + b 2 D 2 + b 3 D 3 + b 4 X i

14 Birden Fazla Kukla Değişkenli Modeller Yıllık Sigara Tüketimi Y i (100 TL) Cinsiyet(D 3 ) Şehir(D 3 ) Yıllık Gelir (X i )(100 TL) 2511400 2000260 1900270 2411360 2001240 2210310 2111280 1800200 1900260 2211320

15 Birden Fazla Kukla Değişkenli Modeller Y i = b 1 + b 2 D 2 + b 3 D 3 + b 4 X i + u i Y i = Sigara Tüketimi D 2 = 1 Sigara Tüketen ErkekD 3 = 1 Şehirde oturanların sigara tüketimi = 0 Sigara Tüketen Kadın = 0 Kırsalda oturanların sigara tüketimi X i = Gelir Dependent Variable: Y VariableCoefficientStd. Errort-StatisticProb. C11.878631.3549778.7666630.0001 D20.6262080.6408240.9771930.3662 D30.6713210.4679921.4344730.2014 X0.0292160.005445.3702810.0017 R-squared0.955074F-statistic42.51767 Adjusted R-squared0.932611Prob(F-statistic)0.000195 S.E. of regression0.586884Akaike info criterion2.061194 Sum squared resid2.066595Schwarz criterion2.182228 Durbin-Watson stat2.222562Hannan-Quinn criter.1.92842

16 1.Sabit Terimlerin Farklı Eğimlerin Eşit olması Y i =  1 +  2 D i +  X i + u i Y i = Sigara Tüketimi D i = 1 Sigara Tüketen Erkek = 0 X i = Gelir E( Y i |X i,D i = 0 ) =    X i E ( Y i |X i,D i = 1) = (   +    X i

17 Kukla değişken ve Sayısal Değişkenli Model       Y i =  1 +  2 D i +  2 X i + u i

18 2. Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali Y i =  1 +  1 D i X i +  2 X i + u i Y i = Sigara Tüketimi D i = 1 Sigara Tüketen Erkek = 0 X i = Gelir E( Y i |X i,D i = 0 ) =    2 X i E ( Y i |X i,D i = 1) =   + (    2  X i

19 19 ) )      11 YiYi XiXi E( Y i |X i,D i = 0 ) =    2 X i E ( Y i |X i,D i = 1) =   + (    2  X i 2. Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali Y i =  1 +  1 D i X i +  2 X i + u i

20 3. Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması Y i =  1 +  2 D i +  1 D i X i +  2 X i + u i Y i = Sigara Tüketimi D i = 1 Sigara Tüketen Erkek = 0 X i = Gelir E( Y i |X i,D i = 0 ) =    2 X i E ( Y i |X i,D i = 1) = (   +   ) + (    2  X i

21 21 YiYi XiXi )  )          E( Y i |X i,D i = 0 ) =    2 X i E ( Y i |X i,D i = 1) = (   +   ) + (    2  X i 3. Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması Y i =  1 +  2 D i +  1 D i X i +  2 X i + u i

22 22  2 ve  1 ’ün t istatistikleri anlamsızsa iki sınıf sigara tüketim fonksiyonları aynı 2.  2 ve  1 ’ün t istatistikleri anlamlıysa iki sınıf sigara tüketim fonksiyonları farklı (3.durum)  2 ve  1 ’ün t istatistiklerinden  2 anlamsız ve  1 anlamlıysa sabit terim aynı eğim farklıdır. (2. durum) 4.  2 ve  1 ’ün t istatistiklerinden  2 anlamlı ve  1 anlamsızsa sabit terim farklı eğim aynıdır. (1. durum) Y i =  1 +  2 D i +  1 D i X i +  2 X i + u i Modelin t İstatistiklerinin Değerlendirilmesi

23 23 Yıllık Sigara Tüketimi Cinsiyet (D i ) (Erkek = 1, Kadın = 0) Yıllık Gelir (X i ) 251400 200260 190270 241360 200240 221310 211280 180200 190260 221320 İki Sınıf Modellerinin Farklılığının Kukla Değişken Yöntemi İle Testi Y i =  1 +  2 D i +  1 D i X i +  2 X i + u i

24 24 İki Sınıf Modellerinin Farklılığının Kukla Değişken Yöntemi İle Testi Y i =  1 +  2 D i +  1 D i X i +  2 X i + u i Dependent Variable: Y VariableCoefficientStd. Errort-StatisticProb. C14.942312.5983835.7506190.0012 D2-3.7863443.35085-1.1299650.3016 D2*X0.0175550.0122451.4336240.2017 X0.0173080.0105081.647020.1507 R-squared0.95506F-statistic42.50422 Adjusted R-squared0.932591Prob(F-statistic)0.000195 S.E. of regression0.586972Akaike info criterion2.061496 Sum squared resid2.067219Schwarz criterion2.18253 Durbin-Watson stat1.943502Hannan-Quinn criter.1.928722 Dependent Variable: Y VariableCoefficientStd. Errort-StatisticProb. C10.31091.1234939.1775350.0000 X0.0368590.0038049.6890430.0000 R-squared0.921474F-statistic93.87755 Adjusted R-squared0.911659Prob(F-statistic)0.000011 S.E. of regression0.671954Akaike info criterion2.219603 Sum squared resid3.612179Schwarz criterion2.28012 Durbin-Watson stat2.034514Hannan-Quinn criter.2.153216

25 25 2. CHOW testi ile tüketim fonksiyonlarının farklılığının araştırılması Üç grup tüketim fonksiyonu tahmin edilir: H 0 : Erkek ve kadınlar için tüketim fonk. aynıdır. H 1 : Erkek ve kadınlar için tüketim fonk. farklıdır. 1.Erkek-kadın tüm tüketiciler için tüketim fonksiyonu: HKT=3.162 2.Erkekler için tüketim fonksiyonu: HKT=0.2018 3.Kadınlar için tüketim fonksiyonu: HKT=1.865 F test = 2.243 F tab = 5.14 (  =0.05 f 1 =2 f 2 =6 sd. lerinde) H 0 kabul

26 Birden Fazla Kukla Değişkenli Modeller Yıllık Sigara Tüketimi Y i (100 TL) Cinsiyet(D 3 ) Şehir(D 3 ) Yıllık Gelir (X i )(100 TL) 2511400 2000260 1900270 2411360 2001240 2210310 2111280 1800200 1900260 2211320

27 Birden Fazla Kukla Değişkenli Modeller Y i = b 1 + b 2 D 2 + b 3 D 3 + b 4 X i + u i Dependent Variable: Y VariableCoefficientStd. Errort-StatisticProb. C11.878631.3549778.7666630.0001 D20.6262080.6408240.9771930.3662 D30.6713210.4679921.4344730.2014 X0.0292160.005445.3702810.0017 R-squared0.955074F-statistic42.51767 Adjusted R-squared0.932611Prob(F-statistic)0.000195 S.E. of regression0.586884Akaike info criterion2.061194 Sum squared resid2.066595Schwarz criterion2.182228 Durbin-Watson stat2.222562Hannan-Quinn criter.1.92842 Dependent Variable: Y VariableCoefficientStd. Errort-StatisticProb. C11.050451.05380210.486270.0000 D30.8270270.4386111.8855590.1013 X0.0328830.0039268.3752490.0001 R-squared0.947924F-statistic63.70948 Adjusted R-squared0.933045Prob(F-statistic)0.000032 S.E. of regression0.58499Akaike info criterion2.008882 Sum squared resid2.395495Schwarz criterion2.099658 Durbin-Watson stat2.339918Hannan-Quinn criter.1.909302

28 28 BİR MODELDE KUKLA DEĞİŞKENLERİN KARŞILIKLI OLARAK BİRBİRİNİ ETKİLEMELERİ PROBLEMİ Erkeğin Tüketim Farkı Şehirde Oturanların Tüketim Farkı Şehirde Oturan bir Erkeğin Tüketim Farkı

29 Birden Fazla Kukla Değişkenli Modeller Y i = b 1 + b 2 D 2 + b 3 D 3 + b 4 D 2 D 3 + b 5 X i + u i Dependent Variable: Y VariableCoefficientStd. Errort-StatisticProb. C11.401811.3439078.4840760.0004 D21.0812640.7076091.5280530.187 D31.2302480.6261841.9646770.1066 D2*D3-1.1512420.905929-1.2707860.2597 X0.03070.0053115.7801730.0022 R-squared0.966042F-statistic35.55997 Adjusted R-squared0.938875Prob(F-statistic)0.000726 S.E. of regression0.558941Akaike info criterion1.981308 Sum squared resid1.562077Schwarz criterion2.132601 Durbin-Watson stat2.778543Hannan-Quinn criter.1.815341 Y i = b 1 + b 5 X i Y i = b 1 + b 2 D 2 + b 5 X i Y i = b 1 + b 3 D 3 + b 5 X i Y i = b 1 + b 2 D 2 + b 3 D 3 + b 4 D 2 D 3 + b 5 X i

30 30 MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDE N FAYDALANMA Üçer Aylar Karlar (Milyon Dolar) S atışlar (Milyon Dolar) 1965-I10503114862 II12092123968 III10834121454 IV12201131917 1966-I12245129911 II14001140976 III12213137828 IV12820145465 D2D2 0 1 0 0 0 1 0 0 D3D3 0 0 1 0 0 0 1 0 D4D4 0 0 0 1 0 0 0 1

31 31 MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Dependent Variable: Kar Variable Coefficient Std. Error t-Statistic Prob. C 6688.363 1711.3663.908200.0009 D 2 1322.892 638.4745 2.0719570.0521 D 3 -217.8054 632.2552 -0.3444900.7343 D 4 183.8564 654.2925 0.2810000.7817 Satış 0.038246 0.011481 3.3312810.0035 R 2 =0.525494 İstatistiki olarak anlamsız

32 32 MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Dependent Variable: Kar Sample: 1965:1 1970:4 VariableCoefficientStd. Error t-Statistic Prob. C 6515.5811623.083 4.0143230.0006 D 2 1331.352493.0214 2.7003950.0134 Satış 0.0393100.010575 3.7173150.0013 R 2 = 0.515460 Mevsim dalgalanmalarının etkisinde

33 33 Parçalı Doğrusal Regresyon X*X* Satış Komisyonları Y X Bir sigorta şirketi satış temsilcilerinin belli bir satış hacmini geçmesi durumunda çalışanlarına komisyon ödemektedir. Şirket içerisinde gerçekleştirilen satış komisyon ücretleri belli bir satış hacmi(X * ) eşik düzeyine kadar doğrusal artmakta ve bu eşik düzeyinden sonra ise daha dik bir oranla satışlarla doğrusal olarak arttığı varsayılmaktadır. Bu durumda I ve II olarak numaralandırılmış iki parçadan oluşan parçalı doğrusal regresyona ve eşik düzeyinde eğimin değiştiği komisyon fonksiyonuna sahip olmuş oluruz. I II

34 34 Parçalı Doğrusal Regresyon Satış Komisyonları Y X Satışlar X*X* E(Y i | D i =1,X i, X * ) =  1 -  2 X * +(  1 +  2 )X i Y i = Satış Komisyonları X i = Satış Miktarı X * = Satışlarda Prim Eşik Değeri D= 1 Eğer X i > X * = 0 Eğer X i < X * E(Y i | D i =0,X i, X * ) =  1 +  1 X i Y i =  1 +  1 X i +  2 (X i -X * )D i +u i

35 35 Parçalı Doğrusal Regresyon Satış Komisyonları Y X Satışlar 11 1-2X*1-2X* 1 1 1+21+2 11 X*X*

36 36 Örnek Total Cost($) TC Output( units) Q DiDi 25610000 41420000 63430000 77840000 100350000 183960001 208170001 242380001 273490001 2914100001 Dependent Variable: TC Included observations: 10 VariableCoefficientStd. Errort-StatisticProb. C-145.7167176.7341-0.8244960.4368 Q0.2791260.0460086.0668770.0005 (Q-5500)*DI0.0945000.0825521.1447270.2899 R 2 =0.973706 F-statistic=129.6078 [0.000003] İstatistiki olarak anlamsız Satışlardaki artışlar prim değerini arttırmamaktadır. Bir şirket satış temsilcilerinin belli bir satış hacmini geçmesi durumunda çalışanlarına prim ödemektedir. H 0 : Satışlardaki artışlar prim değerini arttırmamaktadır. H 1 : Satışlardaki artışlar prim değerini arttırmaktadır.

37 37 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI UYGULAMA: 1935-1954 yıllarına arasında General Motor, Westinghouse ve General Electric firmalarına ait yatırım (Y), firmanın değeri (X 2 ) ve sermaye stoğu (X 3 ) verilerine ait tablo aşağıda verilmiştir.

38 38 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI Firmaların yatırımları arasında fark olup olmadığını inceleyebilmek için de kukla değişkenlerden yararlanabiliriz. Firmaların ilk üç yılına ait veriler ile oluşturulan yeni tablo aşağıdaki gibidir. YıllarY X2X3DiDi Firma 1935 317.63078.52.81GM 1936 391.84661.752.61GM 1937 410.65387.1156.91GM 1935 12.93191.51.80WE 1936 25.90516.00.80WE 1937 35.05729.07.40WE 1935 33.11170.697.80GE 1936 45.02015.8104.40GE 1937 77.22803.3118.00GE General Motor(GM), Westinghouse(WE) ve General Electric (GE) yatırım (Y), firmanın değeri (X2 ) ve sermaye stoğu (X3)

39 39 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI GM yatırımlarının diğer firma yatırımlarından sabit terim kadar farklı olduğunu ifade etmektedir.

40 40 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI Dependent Variable: Y Method: Least Squares Included observations: 60 VariableCoefficientStd. Errort-StatisticProb. C-61.8075423.79039-2.5980040.0120 X20.0383110.0167522.2868840.0260 X30.3473030.03204810.836830.0000 DI278.591151.743385.3840910.0000 R-squared0.924866 Mean dependent var251.067 Adjusted R-squared0.920841 S.D. dependent var311.6501 S.E. of regression87.68352 Akaike info criterion11.84969 Sum squared resid430550.4 Schwarz criterion11.9893 Log likelihood-351.4906 F-statistic229.7778 Durbin-Watson stat0.502776 Prob(F-statistic)0.000000 İstatistiksel olarak anlamlı

41 41 ÖRNEKLER

42 42 DATA7-19 1960-1988 yılları arasında Türkiye’deki Sigara Tüketimi Q Yetişkinlerin sigara tüketim miktarı(kg), Range 1.86 - 2.723. Y GNP(1968) TL,Range 2560 - 5723. PTürkiye’deki sigara fiyatları Range 1.361 - 3.968. ED1Kayıtlı ortaokul ve lise mezunu nüfus oranı(12-17 yaş) Range 0.112 - 0.451. ED2Kayıtlı üniversite mezunu oranı (20-24) Range 0.026 - 0.095. D82= 1, 1982 ve sonrası D86= 1, 1986 ve sonrası

43 43 Dependent Variable: Q Sample: 1960 1988 Included observations: 29 VariableCoefficientStd. Error t-Statistic Prob. P-0.0972910.079389 -1.225493 0.2340 ED2-5.5472952.679248 -2.07046 0.0509 ED1-2.9941662.708828 -1.105336 0.2815 D86-0.2627000.090825 -2.89238 0.0087 D82-0.2887390.083649 -3.451774 0.0024 Y0.0007620.000190 4.009205 0.0006 C5.1139345 0.34132 0.101585 0.9200 Katsayılar istatistiksel olarak anlamsız

44 44 Dependent Variable: Q Method: Least Squares Sample: 1960 1988 Included observations: 29 VariableCoefficientStd. Errort-StatisticProb. ED2-6.4552592.724204-2.3695950.0266 D86-0.3518220.078985-4.4542970.0002 D82-0.2694290.084743-3.1793850.0042 Y0.0006720.0001703.9452280.0006 C58.1887833.266181.7491870.0936

45 45 DATA7-2 Belirli bir şirkette çalışan 49 kişinin istihdam durumu ve ücretleri WAGE = Aylık Ücret (Range 981 - 3833) EDUC = 8 yıllık eğitimden sonraki sahip olunan eğitim seviyesi(Range 1 - 11) EXPER =Şirkette çalışma süresi(Range 1 - 23) AGE = Yaş (25 - 64) GENDER = 1, Erkek ise; 0 kadın ise RACE = 1, beyaz ise; 0 diğerleri CLERICAL = 1 büro memuru ise, 0 diğerleri MAINT = 1 bakım işlerinde çalışıyor ise; 0 diğerleri CRAFTS =1,usta ise; 0 diğerleri Temel sınıf Profesyonel meslek grupları.

46 46 Dependent Variable: WAGE Method: Least Squares Included observations: 49 VariableCoefficientStd. Errort-StatisticProb. C1637.202263.67266.2092240.0000 EDUC49.3317827.996781.7620520.0855 EXPER27.295099.4888832.8765330.0064 GENDER473.6966152.48183.1065780.0034 RACE207.0888130.44911.5875060.1201 CLERICAL-946.7380174.6505-5.4207580.0000 MAINT-1053.424203.4297-5.1783200.0000 CRAFTS-708.8822176.0507-4.0265800.0002 R-squared0.737516 Mean dependent var1820.204 Adjusted R-squared0.692702 S.D. dependent var648.2687 S.E. of regression359.3643 Akaike info criterion14.75483 Sum squared resid5294850. Schwarz criterion15.06370 Log likelihood-353.4934 F-statistic16.45717 Durbin-Watson stat2.107977 Prob(F-statistic)0.000000

47 47 DATA 7-9 1985 yılında koleje giriş yapan öğrencilerin ilk yıl başarılarını göstermekte colgpa = 1986 sonbaharındaki ortalamaları (Range 0.85 - 3.97) hsgpa = Lise GPA (Range 2.29 - 4.5) vsat = Sözel derecesi (Range 200 - 700) msat = Sayısal derecesi (Range 330 - 770) dsci = 1 Bilim dalı için, 0 diğerleri dsoc = 1 Sosyal bilim dallı için, 0 diğerleri dhum = 1 Beşeri bilimdalı için 0 diğerleri darts = 1 Sanat dalı için, 0 diğerleri dcam = 1 Öğrenci kampüste yaşıyorsa, 0 diğerleri dpub = 1 Genel lise mezunu ise, 0 diğerleri

48 48 Dependent Variable: COLGPA Method: Least Squares Sample: 1 427 Included observations: 427 VariableCoefficientStd. Errort-StatisticProb. C0.3672960.2243021.6375060.1023 HSGPA0.4059140.0634186.4006300.0000 VSAT0.0007260.0002902.5039070.0127 MSAT0.0010860.0003033.5866090.0004 DSCI-0.0273230.057319-0.4766730.6338 DSOC0.0561480.0727780.7714940.4409 DHUM-0.0040590.141771-0.0286320.9772 DARTS0.2286500.1889211.2102940.2269 DCAM-0.0407050.052162-0.7803620.4356 DPUB0.0294030.0630400.466416 0.6412 Katsayılar istatistiki olarak anlamsız

49 49 Dependent Variable: COLGPA VariableCoefficient Std. Error t-Statistic Prob. C0.4232490.2197491.9260530.0548 HSGPA0.3983490.0605866.5748820.0000 VSAT0.0007370.0002812.6273610.0089 MSAT0.0010150.0002943.4577490.0006

50 Bağımlı Kukla Değişkenler Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla değişkenler söz konusudur. Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır: -Doğrusal Olasılık Modeli -Logit Modeli -Probit Modeli -Tobit Modeli

51 Doğrusal Olasılık Modeli Y i = 1Eğer i. Birey istenen özelliğe sahipse 0Diğer Durumlarda X i = Bağımsız değişken Bu modele olasılıklı model denmesinin nedeni, Y’nin X için şartlı beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır. E(Y i |X i )= Pr(Y i =1| X i ) Y i = b 1 + b 2 X i +u i

52 Doğrusal Olasılık Modeli E(Y i |X i )= b 1 + b 2 X i E(u i ) = 0 Y i değişkeninin olasılık dağılımı: Y i Olasılık 01-P i 1Pi1Pi Toplam1 E(Y i |X i ) = SY i P i =0.(1-P i ) + 1.(P i )= P i E(Y i |X i )= b 1 + b 2 X i 0  E(Y i |X i )  1

53 DOM Tahminindeki Sorunlar u i hata teriminin normal dağılmayışı: Normallik varsayımının sağlanmaması durumunda tahmin ediciler sapmasızlıklarını korurlar. Nokta tahminde normallik varsayımı gözardı edilir. Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla normal dağılıma uyarlar. DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı altındaki EKK sürecine uyarlar.

54 u’ların Binom Dağılımlı Olması EKKY varsayımlarından biri u değerlerinin dağılımının normal olmasıdır. Bu varsayım sayesinde katsayı tahminlerinin güven aralıkları hesaplanıp, test yapılabilmektedir. DOM’de u’lar normal dağılmaz, binom dağılımı gösterir: Y 1 ve 0 değerini aldığında Y i =1 için Y i =0 için u lar normal değildir. İki değerli binom dağılımlıdır. Ancak büyük örneklerde DOM güven aralıkları ve hipotez testleri geçerlidir ve EKKY normal dağılım varsayımının sağlandığı kabul edilmektedir.

55 YiYi uiui İhtimal=P(u i ) 0-b 1 -b 2 X(1-P i ) 11-b 1 -b 2 XPiPi u i hata teriminin değişen varyanslı olması: DOM’de u lar eşit varyanslı değillerdir. Bunun için kesikli bir Y değişkeni varyansından hareketle Y yerine u alınarak

56 u’nun varyansı farklıdır. u’nun varyansı Y’nin X için şartlı beklenen değerine bağlıdır ve sonuçta u’nun varyansı X’in değerine bağlı olacak ve eşit olmayacaktır. DOM’nin EKKY ile tahmininde ortaya çıkan farklı varyans problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm getirmek mümkündür: u i hata teriminin değişen varyanslı olması: Var(u i ) = P i (1-P i )

57 DOM’de Farklı Varyansı Önleme ler bilinmediğinden bunun yerine örnek tahmini değerleri hesaplanarak ifadesinde yerine konarakler kullanılır. 0  E(Y i |X i )  1 varsayımının yerine gelmeyişi DOM’de Y’nin şartlı olasılığını gösteren E(Y|X) nın 0 ila 1 arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.Bu şart anakütle için geçerlidir. Anakütlenin tahmincisi için geçerli olmayabilir. Tahmini şartlı olasılıklar 0 ile 1 olmayabilir:

58 0  E(Y i |X i )  1 0 ile 1 arasında mıdır? DOM”, EKKY ile elde edildikten sonra eşit olduğu kabul edilir. Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için 0 değerini alır. 1’den büyük değerli ise bunlar için nin 1’e Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın kalktığı görülebilir. eşit varyanslıdır. Bu yöntem TEKKY’dir.

59 Doğrusal Olasılık Modeli D i = b 1 + b 2 M i +b 3 S i +u i D i = 1Eğer i. Kadının bir işi varsa ya da iş arıyorsa 0Diğer Durumlarda M i = 1Eğer i. Kadın evliyse diğer durumlarda 0 S i = i.kadının yıl olarak aldığı eğitim A i = i. Kadının Yaşı

60 DiDi MiMi AiAi SiSi DiDi MiMi AiAi SiSi 103116103510 113414114014 114116014310 00679013712 102512102713 015812102814 104514114812 10551001667 004312014411 10558012112 102511114010 104114104115 016212012310 115113013111 01399114412 Kadının İşgücüne Katılımı Modeli: D i = 1 i.Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda M i = 1 i. Kadın evliyse 0 diğer durumlarda S i = i.kadının yıl olarak aldığı eğitim A i = i. Kadının Yaşı

61 Kadının İşgücüne Katılımı Modeli D i = b 1 + b 2 M i +b 3 S i +u i Dependent Variable: D I Included observations: 30 VariableCoefficientStd. Errort-StatisticProb. C-0.2843010.435743-0.6524520.5196 M I -0.3817800.153053-2.4944300.0190 S I 0.0930120.0345982.6884020.0121 R-squared0.363455 Mean dependent var0.600000 Adjusted R-squared0.316304 S.D. dependent var0.498273 S.E. of regression0.412001 Akaike info criterion1.159060 Sum squared resid4.583121 Schwarz criterion1.299179 Log likelihood-14.38590 F-statistic7.708257 Durbin-Watson stat2.550725 Prob(F-statistic)0.002247 M i = 1 Kadın evliyse ;0 diğer durumlarda ; S i = i.kadının yıl olarak aldığı eğitim A= Kadının Yaşı

62 White Heteroskedasticity Test: F-statistic1.759076 Probability0.168742 Obs*R-squared6.589061 Probability0.159265 Dependent Variable: RESID^2 Included observations: 30 VariableCoefficientStd. Errort-StatisticProb. C-0.3906200.700490-0.5576390.5821 MI-0.4106590.315325-1.3023360.2047 MI*SI0.0362020.0262251.3804290.1797 SI0.1324210.1166351.1353440.2670 SI^2-0.0071020.004809-1.4768220.1522 R-squared0.219635Mean dependent var 0.15277 Adjusted R-squared0.094777 S.D. dependent var 0.16180 S.E. of regression0.153942 Akaike info criterion -0.75347 Sum squared resid0.592452 Schwarz criterion 0.51994 Log likelihood16.30209 F-statistic 1.75907 Durbin-Watson stat1.963424 Prob(F-statistic) 0.16874

63 DOM’de Farklı Varyansı Önleme Dependent Variable: Included observations: 30 Variable CoefficientStd. Errort-StatisticProb. -0.1841540.316834-0.5812310.5659 -0.3628930.135229-2.6835510.0123 0.0816780.0222313.6740220.0010 R-squared0.872710 Mean dependent var2.190469 Adjusted R-squared0.863281 S.D. dependent var2.514662 S.E. of regression0.929809 Akaike info criterion2.786965 Sum squared resid23.34273 Schwarz criterion2.927085 Log likelihood-38.80448 F-statistic92.55700 Durbin-Watson stat2.583787 Prob(F-statistic)0.000000

64 UYGULAMA:Cep telefonunun kullanılıp kullanılmamasını ifade eden bağımlı kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile açıklanmıştır.(Y=1, cep telefonuna sahip ise, Y=0 cep telefonuna sahip değilse) KişiYX(Gelir)Z(Yaş)KişiYX(Gelir)Z(Yaş) 112502326018521 213502127125021 301502328150021 416002229179023 512002230150022 601502031167522 713902732149022 802001833150021 909002534176021 1001501835155026 1102551836140024 1203002037120021 1316402538022021 1415002739117523 1513002240184021 1605501941115023 1718001842120023 1818752143120023 1906001744148523 2005002045125021 05001946130020 2215002147147019 2315502248180023 2417502149025021 2512252350013023

65 Dependent Variable: Y Method: Least Squares Included observations: 50 VariableCoefficientStd. Errort-StatisticProb. C-1.3730860.585035-2.3470170.0232 X0.0004920.0002591.9003720.0635 Z0.0861300.0267813.2160410.0024 R-squared0.2401 Mean dependent var0.700 Adjusted R-squared0.207770 S.D. dependent var0.462910 S.E. of regression0.412024 Akaike info criterion1.122653 Sum squared resid7.978889Schwarz criterion1.2373 Log likelihood-25.06633F-statistic7.425357 Durbin-Watson stat1.552777 Prob(F-statistic)0.001577 Y=1, cep telefonuna sahip ise, Y=0 cep telefonuna sahip değilse; X(Gelir); Z(Yaş)

66 White Heteroskedasticity Test: F-statistic2.305076 Probability0.060504 Obs*R-squared10.37848 Probability0.065195 Dependent Variable: RESID^2 Included observations: 50 VariableCoefficientStd. Errort-StatisticProb. C2.3413772.1476121.0902240.2815 X-0.0044040.001530-2.8781460.0062 X^21.63E-066.58E-072.4751470.0172 X*Z0.0001326.84E-051.9279240.0603 Z-0.1164570.191111-0.6093690.5454 Z^20.0013010.0043960.2959150.7687 R-squared0.207570Mean dependent var0.159578 Adjusted R-squared0.117521S.D. dependent var0.225222 S.E. of regression0.211574Akaike info criterion-0.156314 Sum squared resid1.969602 Schwarz criterion0.073128 Log likelihood9.907860 F-statistic2.305076 Durbin-Watson stat2.375111 Prob(F-statistic)0.060504

67 Kişi 1 0.7308 16 0.5338 31 0.8536 46 0.4970 2 0.6077 17 0.5705 32 0.7627 47 0.4944 3 0.6817 18 0.8658 33 0.6815 48 1.0012 4 0.8167 19 0.3861 34 0.8093 49 0.5586 5 0.6201 20 0.5953 35 1.1367 50 0.6718 6 0.4233 21 0.5092 36 0.8907 7 1.1442 22 0.6815 37 0.5340 8 0.2756 23 0.7922 38 0.5438 9 1.2226 24 0.8044 39 0.6939 10 0.2510 25 0.7185 40 0.8486 11 0.3026 26 0.5266 41 0.6817 12 0.4970 27 0.5586 42 0.7062 13 1.0948 28 0.6815 43 0.7062 14 1.1982 29 0.9963 44 0.8463 15 0.6693 30 0.7676 45 0.5586

68 Dependent Variable: Method: Least Squares Sample: 1 50 Included observations: 44 Excluded observations: 6 VariableCoefficientStd. Errort-StatisticProb. -1.9601270.591996-3.3110480.0019 0.0004680.0001702.7542800.0087 0.1145510.0281944.0629390.0002 R-squared0.899751Mean dependent var1.9024 Adjusted R-squared0.894861S.D. dependent var2.504969 S.E. of regression0.812241Akaike info criterion2.487706 Sum squared resid27.04915Schwarz criterion2.609356 Log likelihood-51.72954F-statistic183.9907 Durbin-Watson stat1.728717Prob(F-statistic)0.000000


"Mehmet Vedat PAZARLIOĞLU KUKLA DEĞİŞKENLER. Kukla Değişken Nedir? Cinsiyet, eğitim seviyesi, meslek, din, ırk, bölge, tabiiyet, savaşlar, grevler, siyasi." indir ppt

Benzer bir sunumlar


Google Reklamları