Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Bağımlı Kukla Değişkenler Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla.

Benzer bir sunumlar


... konulu sunumlar: "Bağımlı Kukla Değişkenler Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla."— Sunum transkripti:

1 Bağımlı Kukla Değişkenler Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla değişkenler söz konusudur. Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır: -Doğrusal Olasılık Modeli -Logit Modeli -Probit Modeli -Tobit Modeli

2 Doğrusal Olasılık Modeli Y i = b 1 + b 2 X i +u i Y i = 1Eğer i. Birey istenen özelliğe sahipse 0Diğer Durumlarda X i = Bağımsız değişken Bu modele olasılıklı model denmesinin nedeni, Y’nin X için şartlı beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır. E(Y i |X i )=Pr(Y i =1| X i )

3 Doğrusal Olasılık Modeli E(Y i |X i )= b 1 + b 2 X i E(u i ) = 0 Y i değişkeninin olasılık dağılımı: Y i Olasılık 01-P i 1Pi1Pi Toplam1 E(Y i |X i ) =  Y i P i =0.(1-P i ) + 1.(P i ) = P i E(Y i |X i )= b 1 + b 2 X i 0  E(Y i |X i )  1

4 DOM Tahminindeki Sorunlar u i hata teriminin normal dağılmayışı: Normallik varsayımının sağlanmaması durumunda tahmin ediciler sapmasızlıklarını korurlar. Nokta tahminde normallik varsayımı gözardı edilir. Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla normal dağılıma uyarlar. DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı altındaki EKK sürecine uyarlar.

5 u’ların Binom Dağılımlı Olması EKKY varsayımlarından biri u değerlerinin dağılımının normal olmasıdır. Bu varsayım sayesinde katsayı tahminlerinin güven aralıkları hesaplanıp, test yapılabilmektedir. DOM’de u’lar normal dağılmaz, binom dağılımı gösterir: Y 1 ve 0 değerini aldığında Y i =1 için Y i =0 için u lar normal değildir. İki değerli binom dağılımlıdır. Ancak büyük örneklerde DOM güven aralıkları ve hipotez testleri geçerlidir ve EKKY normal dağılım varsayımının sağlandığı kabul edilmektedir.

6 YiYi uiui İhtimal=P(u i ) 0-b 1 -b 2 X(1-P i ) 11-b 1 -b 2 XPiPi u i hata teriminin değişen varyanslı olması: DOM’de u lar eşit varyanslı değillerdir. Bunun için kesikli bir Y değişkeni varyansından hareketle Y yerine u alınarak

7 u’nun varyansı farklıdır. u’nun varyansı Y’nin X için şartlı beklenen değerine bağlıdır ve sonuçta u’nun varyansı X’in değerine bağlı olacak ve eşit olmayacaktır. DOM’nin EKKY ile tahmininde ortaya çıkan farklı varyans problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm getirmek mümkündür: u i hata teriminin değişen varyanslı olması: Var(u i ) = P i (1-P i )

8 DOM’de Farklı Varyansı Önleme ler bilinmediğinden bunun yerine örnek tahmini değerleri hesaplanarak ifadesinde yerine konarakler kullanılır. 0  E(Y i |X i )  1 varsayımının yerine gelmeyişi DOM’de Y’nin şartlı olasılığını gösteren E(Y|X) nın 0 ila 1 arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.Bu şart anakütle için geçerlidir. Anakütlenin tahmincisi için geçerli olmayabilir. Tahmini şartlı olasılıklar 0 ile 1 olmayabilir:

9 0  E(Y i |X i )  1 0 ile 1 arasında mıdır? DOM”, EKKY ile elde edildikten sonra eşit olduğu kabul edilir. Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için 0 değerini alır. 1’den büyük değerli ise bunlar için nin 1’e Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın kalktığı görülebilir. eşit varyanslıdır. Bu yöntem TEKKY’dir.

10 Doğrusal Olasılık Modeli D i = b 1 + b 2 M i +b 3 S i +u i D i = 1Eğer i. Kadının bir işi varsa ya da iş arıyorsa 0Diğer Durumlarda M i = 1Eğer i. Kadın evliyse diğer durumlarda 0 S i = i.kadının yıl olarak aldığı eğitim A i = i. Kadının Yaşı

11 DiDi MiMi AiAi SiSi DiDi MiMi AiAi SiSi 103116103510 113414114014 114116014310 00679013712 102512102713 015812102814 104514114812 10551001667 004312014411 10558012112 102511114010 104114104115 016212012310 115113013111 01399114412 Kadının İşgücüne Katılımı Modeli: D i = 1 i.Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda M i = 1 i. Kadın evliyse 0 diğer durumlarda S i = i.kadının yıl olarak aldığı eğitim A i = i. Kadının Yaşı

12 Kadının İşgücüne Katılımı Modeli D i = b 1 + b 2 M i +b 3 S i +u i Dependent Variable: D I Included observations: 30 VariableCoefficientStd. Errort-StatisticProb. C-0.2843010.435743-0.6524520.5196 M I -0.3817800.153053-2.4944300.0190 S I 0.0930120.0345982.6884020.0121 R-squared0.363455 Mean dependent var0.600000 Adjusted R-squared0.316304 S.D. dependent var0.498273 S.E. of regression0.412001 Akaike info criterion1.159060 Sum squared resid4.583121 Schwarz criterion1.299179 Log likelihood-14.38590 F-statistic7.708257 Durbin-Watson stat2.550725 Prob(F-statistic)0.002247 M i = 1 Kadın evliyse ;0 diğer durumlarda ; S i = i.kadının yıl olarak aldığı eğitim A= Kadının Yaşı

13 White Heteroskedasticity Test: F-statistic1.759076 Probability0.168742 Obs*R-squared6.589061 Probability0.159265 Dependent Variable: RESID^2 Included observations: 30 VariableCoefficientStd. Errort-StatisticProb. C-0.3906200.700490-0.5576390.5821 MI-0.4106590.315325-1.3023360.2047 MI*SI0.0362020.0262251.3804290.1797 SI0.1324210.1166351.1353440.2670 SI^2-0.0071020.004809-1.4768220.1522 R-squared0.219635Mean dependent var 0.15277 Adjusted R-squared0.094777 S.D. dependent var 0.16180 S.E. of regression0.153942 Akaike info criterion -0.75347 Sum squared resid0.592452 Schwarz criterion 0.51994 Log likelihood16.30209 F-statistic 1.75907 Durbin-Watson stat1.963424 Prob(F-statistic) 0.16874

14 DOM’de Farklı Varyansı Önleme Dependent Variable: Included observations: 30 Variable CoefficientStd. Errort-StatisticProb. -0.1841540.316834-0.5812310.5659 -0.3628930.135229-2.6835510.0123 0.0816780.0222313.6740220.0010 R-squared0.872710 Mean dependent var2.190469 Adjusted R-squared0.863281 S.D. dependent var2.514662 S.E. of regression0.929809 Akaike info criterion2.786965 Sum squared resid23.34273 Schwarz criterion2.927085 Log likelihood-38.80448 F-statistic 92.55700 Durbin-Watson stat2.583787 Prob(F-statistic)0.000000

15 UYGULAMA:Cep telefonunun kullanılıp kullanılmamasını ifade eden bağımlı kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile açıklanmıştır.( Y=1, cep telefonuna sahip ise, Y=0 cep telefonuna sahip değilse) KişiYX(Gelir)Z(Yaş)KişiYX(Gelir)Z(Yaş) 112502326018521 213502127125021 301502328150021 416002229179023 512002230150022 601502031167522 713902732149022 802001833150021 909002534176021 1001501835155026 1102551836140024 1203002037120021 1316402538022021 1415002739117523 1513002240184021 1605501941115023 1718001842120023 1818752143120023 1906001744148523 2005002045125021 05001946130020 2215002147147019 2315502248180023 2417502149025021 2512252350013023

16 Dependent Variable: Y Method: Least Squares Included observations: 50 VariableCoefficientStd. Errort-StatisticProb. C-1.3730860.585035-2.3470170.0232 X0.0004920.0002591.9003720.0635 Z0.0861300.0267813.2160410.0024 R-squared0.2401 Mean dependent var0.700 Adjusted R-squared0.207770 S.D. dependent var0.462910 S.E. of regression0.412024 Akaike info criterion1.122653 Sum squared resid7.978889Schwarz criterion1.2373 Log likelihood-25.06633F-statistic7.425357 Durbin-Watson stat1.552777 Prob(F-statistic)0.001577 Y=1, cep telefonuna sahip ise, Y=0 cep telefonuna sahip değilse; X(Gelir); Z(Yaş)

17 White Heteroskedasticity Test: F-statistic2.305076 Probability0.060504 Obs*R-squared10.37848 Probability0.065195 Dependent Variable: RESID^2 Included observations: 50 VariableCoefficientStd. Errort-StatisticProb. C2.3413772.1476121.0902240.2815 X-0.0044040.001530-2.8781460.0062 X^21.63E-066.58E-072.4751470.0172 X*Z0.0001326.84E-051.9279240.0603 Z-0.1164570.191111-0.6093690.5454 Z^20.0013010.0043960.2959150.7687 R-squared0.207570Mean dependent var0.159578 Adjusted R-squared0.117521S.D. dependent var0.225222 S.E. of regression0.211574Akaike info criterion-0.156314 Sum squared resid1.969602 Schwarz criterion0.073128 Log likelihood9.907860 F-statistic2.305076 Durbin-Watson stat2.375111 Prob(F-statistic)0.060504

18 Kişi 1 0.7308 16 0.5338 31 0.8536 46 0.4970 2 0.6077 17 0.5705 32 0.7627 47 0.4944 3 0.6817 18 0.8658 33 0.6815 48 1.0012 4 0.8167 19 0.3861 34 0.8093 49 0.5586 5 0.6201 20 0.5953 35 1.1367 50 0.6718 6 0.4233 21 0.5092 36 0.8907 7 1.1442 22 0.6815 37 0.5340 8 0.2756 23 0.7922 38 0.5438 9 1.2226 24 0.8044 39 0.6939 10 0.2510 25 0.7185 40 0.8486 11 0.3026 26 0.5266 41 0.6817 12 0.4970 27 0.5586 42 0.7062 13 1.0948 28 0.6815 43 0.7062 14 1.1982 29 0.9963 44 0.8463 15 0.6693 30 0.7676 45 0.5586

19 Dependent Variable: Method: Least Squares Sample: 1 50 Included observations: 44 Excluded observations: 6 VariableCoefficientStd. Errort-StatisticProb. -1.9601270.591996-3.3110480.0019 0.0004680.0001702.7542800.0087 0.1145510.0281944.0629390.0002 R-squared0.899751Mean dependent var1.9024 Adjusted R-squared0.894861S.D. dependent var2.504969 S.E. of regression0.812241Akaike info criterion2.487706 Sum squared resid27.04915Schwarz criterion2.609356 Log likelihood-51.72954F-statistic183.9907 Durbin-Watson stat1.728717Prob(F-statistic)0.000000

20 DOM’e Alternatif Model Arama DOM ile ilgili sayılan sorunlar aşılabilir: DOM EKKY nin iki varsayımını yerine getirmez. Hatalar normal dağılımlı değildir ve farklı varyans söz konusu olabilir. En önemli problem DOM’nin P i =E(Y=1|X) nin X i ile doğrusal doğrusal olarak arttığını varsaymasıdır. Yani X’deki marjinal veya küçük bir artış hep sabittir. Gerçek hayatta ise bu, beklenen bir durum değildir.

21 0-1 aralığı dışına çıkmamak koşuluyla, öyle bir model bulunmalı ki P i ile X i arasındaki ilişki eğrisel olsun:X i deki artışlar P i yi de arttırsın. Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir: 0 1 P -- ++ X KDF DOM’e Alternatif Model Arama Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir. Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde kullanılabilir.

22 Logit Model Logistik Dağılım Fonksiyonu kümülatif lojistik dağılım fonksiyonudur. Bahis yada olabilirlik oranı Bu orana örneğin, ev sahibi olma lehine fark oranı denir. Lojistik modelin her iki tarafının doğal log. alındığında L i fark oranı logaritması olup hem X, hem parametrelere göre doğrusaldır.Z değişkeni - dan + a değişirken, P 0 ile 1 arasında değişir.

23 Logit Model DOM’de şeklindedir. Logit modelde olasılık

24 Z i, -  ile +  arasında değerler alırken P i ’nin aldığı değerler ise 0 ile 1 arasında değişmektedir. Z i ile P i arasındaki ilişki doğrusal değildir. Logit Model

25 Logit Modelin Özellikleri P i =1 = +  P i =0 = -  1.P i, 0’dan 1’e kadar değer aldığında, Logitte -  ile +  arasında değer alır. 2.Logit, X’e göre doğrusal iken olasılıklara göre değildir. 3.Logit modelin b 2 katsayısı; bağımsız değişkendeki bir birimlik değişme karşısında logitteki değişmeyi gösterir. 4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.

26 2 Bir olayın gerçekleşme olasılığının birden büyük olması durumundan kaçınmak için olasılığın Z’nin S şeklinde bir fonksiyonu olduğunu varsaymak gerekir. Z, açıklayıcı değişkenlerin fonksiyonu olarak ifade edilebilir. Logit Model

27 3 Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve yukarıda gösterildiği gibi bunlardan biri de lojistik fonksiyondur. Z + sonsuza gideren, e -Z sıfıra gitmekte, ve p 1’e gitmektedir. (fakat 1’i geçmemektedir.). Z – sonsuza giderken, e -Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın altına inmemektedir. ). Logit Model

28 a.Logit Modelin Frekanslı Verilerde EKKY İle Tahmini 1.Adım: olasılıkları hesaplanır. 2.Adım: fark oranı logaritmaları hesaplanır. 3.Adım: orijinal lojistik modeli tahminlenir. Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir.

29 Dönüşümlü veya Tartılı EKK Lojistik Modeli a.Logit Modelin Frekanslı Verilerde EKKY İle Tahmini

30 Logistik Model Uygulaması 300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (X i ) ve ev sahibi olanların sayısı (n i ) aşağıdaki tabloda gösterilmiştir. X Milyon TL) Aile Sayısı= N i Ev Sahibi Olan Aile Sayısı=n i Nispi Frekanslar P i =n i /N i 122050.25 162560.24 2035100.28 2645150.33 3050250.50 4034180.53 5030200.66 6026160.61 7020150.75 8015100.67  N i = 300  n i = 140

31 Logistik Model Uygulaması XiXi 1 12 16 20 26 30 40 50 60 70 80 NiNi 2 20 25 35 45 50 34 30 26 20 15 nini 3 5 6 10 15 25 18 20 16 15 10 PiPi 4=3/2 0.25 0.24 0.28 0.33 0.50 0.53 0.66 0.61 0.75 0.67 1-P i 5=1-4 0.75 0.76 0.72 0.67 0.50 0.47 0.34 0.39 0.25 0.33 P i /1- P i 6=4/5 0.33 0.31 0.39 0.49 1.00 1.13 1.94 1.56 3.00 2.03 LiLi 7=ln(6) -1.1086 -1.1712 -0.9416 -0.7133 0.0000 0.1222 0.6626 0.4446 1.0986 0.7080

32 Logistik Model Uygulaması Dependent Variable: L Method: Least Squares Included observations: 10 VariableCoefficientStd. Errort-StatisticProb. C-1.4097060.215776-6.5331920.0002 X0.0326690.0046677.0000110.0001 R-squared0.859649 Mean dependent var-0.089870 Adjusted R-squared0.842106 S.D. dependent var0.835010 S.E. of regression0.331799 Akaike info criterion0.808280 Sum squared resid0.880723 Schwarz criterion0.868797 Log likelihood-2.041402 F-statistic49.00015 Durbin-Watson stat1.582165 Prob(F-statistic)0.000113

33 Logistik Model Uygulaması v=N.P.(1-P) 8=2.4.5 3.75 4.56 7.05 9.95 12.50 8.47 6.73 6.18 3.75 3.31 vi vi 9=  8 1.9365 2.1354 2.6552 3.1543 3.5355 2.9103 2.5942 2.4859 1.9365 1.8193 L* 10=7.9 -2.1468 -2.5009 -2.5001 -2.4999 0.0000 0.3556 1.7189 1.1052 2.1274 1.2880 X* 11=1.9 23.2379 34.1666 53.1036 82.0134 106.0660 116.4130 129.7112 149.1576 135.5544 145.5472

34 Logistik Model Uygulaması L i * = -1.38056  v i + 0.03363 X i *, s= 0.8421 s(b i ): (0.2315)(0.00556), R 2 = 0.80 t=(-5.9617) (6.0424), d= 1.649,F= 36.95 Gelir bir birim arttığında, ev sahibi olma lehine fark oranının logaritması 0.033 artmaktadır. Bu fark oranına göre belli bir gelir seviyesinde ev sahibi olma olasılığı hesaplanabilir: X=40 iken değerleri yukarıdaki denklemde yerine konduğunda L * =-0.10288 bulunur. olabilirlik oranı

35 40 birim gelirli bir ailenin ev sahibi olma olasılığı %47.43’dür. Lojistik modelden, belli bir gelir seviyesinde gelirdeki bir birimlik artışın ev sahibi olma olasılığını ne ölçüde arttıracağı tahmin edilebilir: formülünden yararlanılır. X=40 iken gelir 1 birim arttığında ev sahibi olma olasılığı [0.03363(1-0.4743)0.4743]=0.00838(%0.8)

36 UYGULAMA: Kasımpatı yaprak bitkilerini öldüren bir ilaçtan 1 Lt suya konan dozlar (X, Miligram), yaklaşık 50cl.’lik bit grupları(N i ) üzerine sıkılmış ve ölen bit sayısı (n i ) aşağıdaki gibi tesbit edilmiştir: Doz(Litre başına mg) X Gruplardaki yaprak biti sayısı (N i ) Ölen (n i )LiLi 2.6506-1.99 3.84816-0.69 5.146240.09 7.749421.79 10.250441.99 Bu verilerle ilgili Logit tahmin modeli aşağıdaki gibidir:

37 Dependent Variable: LI Method: Least Squares Included observations: 5 VariableCoefficientStd. Errort-StatisticProb. C-2.8501330.602091-4.7337230.0179 X0.5250440.0927855.6586860.0109

38 a)Katsayı tahminlerini yorumlayınız b)X=7.7 miligram doz seviyesinde ölüm ihtimali P’yi hesaplayınız.

39 En Yüksek Olabilirlik Yöntemi İstatistikte, tüm anakütleler kendilerine karşılık gelen bir olasılık dağılımı ile tanımlanır. Basit(sıradan) en küçük kareler yöntemi, özünde olasılık dağılımları ile ilgili herhangi bir varsayım içermez. Bu yüzden, çıkarsama yapmada BEK tek başına bir işe yaramaz. BEK, genel bir tahmin yaklaşımından çok regresyon doğrularını bulmada kullanılabilecek bir hesaplama yöntemi olarak görülmelidir.

40 BEK yönteminden daha güçlü kuramsal özellikler gösteren bir başka nokta tahmincisi EYO, yani “en yüksek olabilirlik” (maximum likelihood) yöntemidir. En yüksek olabilirlik yönteminin ardında yatan temel ilke şu beklentidir: “Rassal bir olayın gerçekleşmesi, o olayın, gerçekleşme olasılığının en yüksek olay olmasındandır.” Bu yöntem, 1920’li yıllarda˙Ingiliz istatistikçi Sir Ronald A. Fisher (1890-1962) tarafından bulunmuştur. Ki-kare testi, bayesgil yöntemler ve çeşitli ölçüt modelleri gibi birçok istatistiksel çıkarım yöntemi, temelde EYO yaklaşımına dayanmaktadır.

41 EYO yöntemini anlayabilmek için, elimizde dağılım katsayıları bilinen farklı anakütleler ve rassal olarak belirlenmiş bir örneklem olduğunu varsayalım: Bu örneklemin farklı anakütlelerden gelme olasılığı farklı ve bazı ana kütlelerden gelme olasılığı diğerlerine göre daha yüksektir. Elimizdeki örneklem, eğer bu anakütlelerden birinden alınmışsa, “alınma olasılığı en yüksek anakütleden alınmış olmalıdır” diye düşünülebilir.

42 Kısaca: 1. Anakütlenin olasılık dağılımı belirlenir veya bu yönde bir varsayımda bulunulur. 2. Eldeki örneklem verilerinin, hangi katsayılara sahip anakütleden gelmiş olma olasılığının en yüksek olduğu bulunur. YALTA (2007 – 2008 Ders Notları)

43 1 X Y XiXi 11  1  +  2 X i Y =  1  +  2 X Y = b 1 + b 2 X + u modelinde katsayıların en çok olabilirlik tahminleri yapılmadan önce modelde hata terimi olmadığını ifade edelim. Nokta ile gösterilen yerde Y değerine karşılık gelen X değerinin X i değerine eşit olduğunu görülmektedir. Regresyon Katsayılarının En Yüksek Olabilirlik Tahminleri

44 2 Eğer modele hata terimini eklersek hataların belli bir ortalama ve varyansa bağlı olarak normal dağıldığını varsayabiliriz. X Y XiXi 11  1  +  2 X i Y =  1  +  2 X

45 3 Şekilde gösterilen dağılış hata teriminin önceden tahmin edilen dağılışıdır. Gerçekte hata teriminin dağılışının belli bir değere bağlı olarak modelde normal dağıldığını varsayabiliriz. X Y XiXi 11  1  +  2 X i Y =  1  +  2 X

46 4 X Y XiXi 11  1  +  2 X i Y =  1  +  2 X Ayrıca yatay eksene göre bakıldığında; şekilde gösterilen dağılış X=X i durumunda Y’nin tahmini dağılımını da ifade etmektedir.

47 6 Y değeri  1 +  2 X i e yaklaştıkça göreceli olarak daha yüksek yoğunluğa sahip olmaktadır. X Y XiXi 11  1  +  2 X i Y =  1  +  2 X

48 X Y XiXi 11  1  +  2 X i Y =  1  +  2 X 7 Bununla birlikte  1 +  2 X i den uzaklaştıkça yoğunluk azalmaktadır.

49 8 Y i ‘nin ortalama değeri  1 +  2 X i ve hata terimlerinin standart sapması da , olduğunu varsayarsak. X Y XiXi 11  1  +  2 X i Y =  1  +  2 X Regresyon Katsayılarının En Yüksek Olabilirlik Tahminleri

50 9 Y i ’lerin olasılık yoğunluk fonksiyonları f(Y i ) fonksiyonu ile ifade edilebilir. X Y XiXi 11  1  +  2 X i Y =  1  +  2 X Regresyon Katsayılarının En Yüksek Olabilirlik Tahminleri

51 Tek denklemli ekonometrik modellerin tahmininde EKKY dışında kullanılan alternatif yöntem En Yüksek Olabilirlik Yöntemidir. Büyük örneklerde her iki yöntemde yakın sonuçlar vermektedir. Küçük örneklerde ise EYOBY’de olup sapmalıdır. sapmasızdır. EKKY’de ise İki Değişkenli Basit Regresyon Modelinin En Yüksek Olabilirlik Yöntemi İle Tahmini

52 EYOBY’’nin regresyon modeline uygulanışı şöyledir: Y bağımlı değişkeninin ortalamalı varyanslı normal ve Y i değerlerinin bağımsız dağıldığı varsayılmaktadır. Yani (1)

53 Bu ortalama ve varyansla Y i nin Y 1, Y 2,…,Y n değerlerinin bileşik olasılık yoğunluk fonksiyonu şöyledir: Y’ler birbirinden bağımsız olduğundan, bu bileşik olasılık yoğunluk fonksiyonu, n tane bireysel yoğunluk fonksiyonunun çarpımı olarak yazılabilecektir. (2) (2) deki f(Y i ), (1) deki ortalama ve varyanslı normal dağılımlı yoğunluk fonksiyonu olup şöyle ifade edilir:

54 (3) (3)’ü (1) deki her Y i yerine koyarak aşağıdaki ifadeyi elde ederiz: (4) (4) de Y i ler bilindiğinde ve b 1,b 2 ve s 2 ler bilinmediğinde (4) ifadesine en yüksek olabilirlik fonksiyonu adı verilir ve L(b 1,b 2,s 2 ) şeklinde gösterilir. Ortak yoğunluk fonksiyonları her bir yoğunluk fonksiyonunun çarpımına eşittir.

55 En yüksek olabilirlik yöntemi bilinmeyen b i parametrelerinin, verilen Y’nin gözlenme olasılığının ençok(maksimum) olacak tarzda tahmini esasına dayanır. Bu sebepten b’lerin EYOBY’ ile tahmin için (5) fonksiyonunun maksimumunun araştırılması gerekir. Bu türevdir, türev için en kısa yol (5) in log. nın alınmasıdır. (5)

56

57

58 L fonksiyonunu aşağıdaki gibi yazarız: Örneğin hanenin ev sahibi olması durumu Örneğin hanenin ev sahibi olmaması durumu ifadelerini elde ederiz. Bu da anlamsızdır. EKKY den L fonksiyonundaki parametrelerin tahmini değerlerini bulamayız. Ancak bu parametreler EYOBY ile tahmin edilebilir. b.Logit Modelin EYOBY İle Tahmini = +  = - 

59 Wooldridge Example 17.1 inlf kidslt6 kidsge6 age educ exper nwifeinc expersq Obs: 753 1. inlf =1 kadın işgücüne katılıyorsa 0 katılmıyorsa 2. kidslt6 6 < yaşında küçük çocuk sayısı 3. kidsge6 6-18 yaşları arasındaki çocuk sayısı 4. age kadının yaşı 5. educ eğitim yılı 6. exper deneyim 7. nwifeinc (ailegeliri – ücret*saat)/1000 8. expersq deneyimkare

60 Wooldridge Example 17.1-LOGİT Dependent Variable: INLFMethod: ML - Binary LogitIncluded observations: 753 VariableCoefficientStd. Errorz-StatisticProb. NWIFEINC-0.0213450.008421-2.5346210.0113 EDUC0.2211700.0434405.0914430.0000 EXPER0.2058700.0320576.4220020.0000 EXPERSQ-0.0031540.001016-3.1040930.0019 AGE-0.0880240.014573-6.0402350.0000 KIDSLT6-1.4433540.203585-7.0896950.0000 KIDSGE60.0601120.0747900.8037500.4215 C0.4254520.8603690.4945000.6210 Mean dependent var0.568393 S.D. dependent var0.495630 S.E. of regression0.425963 Akaike info criterion1.088354 Sum squared resid135.1762 Schwarz criterion1.137481 Log likelihood-401.7652 Hannan-Quinn criter.1.107280 Restr. log likelihood-514.8732 Avg. log likelihood-0.533553 LR statistic (7 df)226.2161 McFadden R-squared0.219681 Probability(LR stat)0.000000 Obs with Dep=0325 Total obs753 Obs with Dep=1428

61 DiDi MiMi AiAi SiSi DiDi MiMi AiAi SiSi 103116103510 113414114014 114116014310 00679013712 102512102713 015812102814 104514114812 10551001667 004312014411 10558012112 102511114010 104114104115 016212012310 115113013111 01399114412 Kadının İşgücüne Katılımı Modeli: D i = 1 i.Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda M i = 1 i. Kadın evliyse 0 diğer durumlarda S i = i.kadının yıl olarak aldığı eğitim A i = i. Kadının Yaşı

62 Logit Model Tahminleri Dependent Variable: DI Method: ML - Binary Logit Included observations: 30 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives VariableCoefficientStd. Errorz-StatisticProb. C-5.8959333.324731-1.7733560.0762 MI-2.5861101.180162-2.1913180.0284 SI0.6903680.3158282.1858990.0288 Mean dependent var0.600000 S.D. dependent var0.498273 S.E. of regression0.399177 Akaike info criterion1.085128 Sum squared resid4.302237 Schwarz criterion1.225248 Log likelihood-13.27693 Hannan-Quinn criter.1.129954 Restr. log likelihood-20.19035 Avg. log likelihood-0.442564 LR statistic (2 df)13.82685 McFadden R-squared0.342412 Probability(LR stat)0.000994 Obs with Dep=012 Total obs30 Obs with Dep=118

63 Probit Model Bağımlı kukla değişkenli modellerden kümülatif lojistik fonksiyonundan farklı olarak, normal kümülatif dağılım fonksiyonunu kullanan PROBİT(NORMAL) model vardır. F(z)= P R O B İ T (NORMAL) MODEL Probit modeli şu şekilde tanımlayabiliriz: Herhangi bir i hanesinin ev sahibi olma veya olmama kararının gözlenemeyen bir fayda indeksi I i ’ye bağlı olduğunu varsayalım.

64 I i *  I i  ifadesi, faydanın belli bir eşik değerinden sonra söz konusu olabileceğini gösterir. I i * başlangıç değeri de I i gibi gözlenemez. Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak I i değerleri yukarıdaki regresyon denkleminden tahmin edilir. Tahminciler bulunur. I i = b 1 + b 2 X i I i, bağımsız değişkenlere bağlıdır. Örneğin X i (gelir)değişkeni. Her hane için I i ’nın belli bir değerinden itibaren ev sahibi olma durumu söz konusudur.I i değeri, I i * değerini aştığı zaman hane, ev sahibi olacak aksi durumda olmayacaktır. Y=1 hane ev sahibi Y=0 hane ev sahibi değil. (1)

65 =Standartlaştırılmış Normal KDF P i =Pr(Y=1)=Pr(I i *  I i )=F(I i ) =standartlaştırılmış normal değişken P i =Bir ev sahibi olma olasılığı. (2) Normal dağılım varsayımıyla I i * ın I i den küçük veya eşit olma olasılığı aşağıdaki standartlaştırılmış normal KDF ile hesaplanabilir:

66 Probit Model 0 1 P i =F(I i ) -- ++ 0 1 -- ++ PiPi I i = b 1 + b 2 X i PiPi I i =F -1 (P i ) I i * <=I i verilmişken ev sahibi olma olasılığı P i ordinatta bulunur P i verilmişken, absiste I i bulunur.

67 I i ’yı bulabilmek için 2 no’lu ifadenin tersi alınmalıdır. I i = F -1 (I i )=  F -1 (P i )=b 1 +b 2 X i =Probit model F -1 : normal kümülatif dağılım fonksiyonunun tersi.

68 a. Frekanslı Verilerde Probit Model i EKKY ile Tahmin Etme 1.P i = n i /N i hesaplanır. 2.I i = F -1 (P i )= normal eşdeğer sapma bulunur. 3.I i = b 1 + b 2 X i + u i EKK ile tahmin edilir. 4.İstenirse, I i yerine, (I i + 5)=probit değerleri alınarak, EKKY ile (13.19) tahmin edilir. 5.modelinin hata terimi u i farklı varyanslıdır. Bu sebepten dönüşümlü değerler alınarak TEKKY uygulanabilir:=

69 f i = F -1 (P i ) ifadesine eşit standart normal yoğunluk fonksiyonudur. 6. Büyük örnekler için b i 'lerin güven aralıkları ve hipotez testleri uygulanarak, anakütlede durumun geçerliliği araştırılabilir. 7. Belirlilik katsayısı R 2, modelin fonksiyonel biçiminin iyi seçilip seçilmediği konusunda bize fikir vermez.

70 Probit Model Uygulaması PiPi 0.25 0.24 0.28 0.33 0.50 0.53 0.66 0.61 0.75 0.67 I i =F -1 (P i ) -0.6745 -0.7063 -0.5828 -0.4399 0.0000 0.0752 0.4124 0.2793 0.6745 0.4399 Probitler=Z i =(I i +5) 4.3255 4.2937 4.4172 4.5601 5.0000 5.0752 5.4124 5.2793 5.6745 5.4399 XiXi 12 16 20 26 30 40 50 60 70 80

71 Probit Model Uygulaması I i = -0.8587 + 0.0200 X i, r 2 = 0.8628r= 0.9289 s(b i )(0.0028) s= 0.2d= 1.59 t=(7.094) Z i = 4.1324 + 0.0201 X i, r 2 = 0.8621 r= 0.9285 s(b i ) (0.0028) s= 0.2d= 1.5637 t= (7.071)

72 1 b. EYOBY ile PROBIT ANALİZ Probit analizde S şeklindeki fonksiyon standart normal kümülatif dağılımdır.

73 2 EYOBY, parametrelerin tahminini elde etme de yine kullanılır. b. EYOBY ile PROBIT ANALİZ

74 Wooldridge Example 17.1-PROBİT Dependent Variable: INLFMethod: ML - Binary ProbitIncluded observations: 753 VariableCoefficientStd. Errorz-StatisticProb. NWIFEINC-0.0120240.004840-2.4843270.0130 EDUC0.1309050.0252545.1834850.0000 EXPER0.1233480.0187166.5903480.0000 EXPERSQ-0.0018870.000600-3.1452050.0017 AGE-0.0528530.008477-6.2346560.0000 KIDSLT6-0.8683290.118522-7.3262880.0000 KIDSGE60.0360050.0434770.8281420.4076 C0.2700770.5085930.5310270.5954 Mean dependent var0.568393 S.D. dependent var0.495630 S.E. of regression0.425945 Akaike info criterion1.087124 Sum squared resid135.1646 Schwarz criterion1.136251 Log likelihood-401.3022 Hannan-Quinn criter.1.106050 Restr. log likelihood-514.8732 Avg. log likelihood-0.532938 LR statistic (7 df)227.1420 McFadden R-squared0.220581 Probability(LR stat)0.000000 Obs with Dep=0325 Total obs753 Obs with Dep=1428

75 UYGULAMA: Aşağıda bir okulun eğitimi ile ilgili verileri kullanarak Probit denklemini çıkartınız. GRADE: Yeni bir tekniğin uygulanması sonucu öğrencilerin başarısı PSI: Yeni Bir Ekonomi Öğretme Yöntemi GPA: Ortalama Derece TUCE: Sınav Öncesi Konu ile ilgili Bilgi SKoru

76 Dependent Variable: GRADE Method: ML - Binary Probit Included observations: 32 Convergence achieved after 5 iterations VariableCoefficientStd. Errorz-StatisticProb. C-7.4523202.542472-2.9311310.0034 GPA1.6258100.6938822.3430630.0191 PSI1.4263320.5950382.3970450.0165 TUCE0.0517290.0838900.6166260.5375

77 Dependent Variable: GRADE Method: ML - Binary Logit Sample: 1 32 VariableCoefficientStd. Errorz-StatisticProb. C-13.021354.931317-2.6405410.0083 GPA2.8261131.2629402.2377260.0252 PSI2.3786881.0645632.2344260.0255 TUCE0.0951580.1415540.6722350.5014


"Bağımlı Kukla Değişkenler Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla." indir ppt

Benzer bir sunumlar


Google Reklamları