Bağımlı Kukla Değişkenler

Slides:



Advertisements
Benzer bir sunumlar
ZAMAN SERİLERİ -1 ÖNGÖRÜ :
Advertisements

İLİŞKİLERİ İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ
İstatistik Tahmin ve Güven aralıkları
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
5 Gamma Dağılımı Gamma dağılımının yoğunluk fonksiyonu şöyledir.
Sürekli Olasılık Dağılım (Birikimli-Kümülatif)Fonksiyonu
Sürekli Olasılık Dağılımları
TAHMİNLEYİCİLERİN ÖZELLİKLERİ ÖRNEKLEME DAĞILIMI
KOŞULLU ÖNGÖRÜMLEME.
OLASILIK ve KURAMSAL DAĞILIMLAR
Mehmet Vedat PAZARLIOĞLU
GÖRÜNÜRDE İLİŞKİSİZ REGRESYON MODELLERİ
Farklı Varyans Var(u i |X i ) = Var(u i ) = E(u i 2 ) =  2  Eşit Varyans Y X.
Hatalarda Normal Dağılım
Normal Dağılımlılık EKK tahmincilerinin ihtimal dağılımları u i ’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.  tahminleri için uygulanan.
EŞANLI DENKLEMLİ MODELLER. Eşanlı denklem sisteminde, Y den X e ve X den Y ye karşılıklı iki yönlü etki vardır. Y ile X arasındaki karşılıklı ilişki nedeniyle.
ÇOKLU DOĞRUSAL BAĞLANTI
DOĞRUSAL OLMAYAN REGRESYON MODELLERİ…
İyi Bir Modelin Özellikleri
TOBİT MODELLER.
ÇOKLU DOĞRUSAL BAĞLANTI
Otokorelasyon ut = r ut-1 + et -1 < r < +1 Yt = a + bXt + ut 
OTOKORELASYON.
Otokorelasyon Y t =  +  X t + u t  u t =  u t-1 +  t -1 <  < +1 Birinci dereceden Otokorelasyon Cov (u t,u s )  0  Birinci Dereceden Otoregressif.
OTOKORELASYON.
KUKLA DEĞİŞKENLİ MODELLER
Tüketim Gelir
ORTAK FAKTÖR TESTİ VE DİNAMİK MODEL SPESİFİKASYONU
Normal Dağılım EKK tahmincilerinin ihtimal dağılımları u i ’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.  tahminleri için uygulanan testlerin.
SÜREKLİ ŞANS DEĞİŞKENLERİ
Normal Dağılımlılık EKK tahmincilerinin ihtimal dağılımları u i ’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.  tahminleri için uygulanan.
ÖNGÖRÜMLEME (Forecasting)
EKONOMİK DEĞİŞKENLER ARASINDAKİ İLİŞKİLERİN TAHMİNİNDE BAYES YAKLAŞIMI
Mehmet Vedat PAZARLIOĞLU
…ÇOKLU REGRESYON MODELİ…
Farklı Varyans Var(u i |X i ) = Var(u i ) = E(u i 2 ) =  2  Eşit Varyans Y X 1.
Farklı Varyans Var(u i |X i ) = Var(u i ) = E(u i 2 ) =  2  Eşit Varyans Y X.
Olasılık Dağılımları ve Kuramsal Dağılışlar
İSTATİSTİK YGULAMALARI: SINAVA HAZIRLIK
KESİKLİ RASSAL DEĞİŞKENLER
Sayısal Analiz Sayısal Türev
Sayısal Analiz 7. Hafta SAÜ YYurtaY.
HİPOTEZ TESTLERİNE GİRİŞ
Maliye’de SPSS Uygulamaları
İstatistik Tahmin ve Güven aralıkları
Bölüm 7 Coklu regresyon.
Bağımlı Kukla Değişkenler
İKİ DEĞİŞKENLİ BASİT DOĞRUSAL REGRESYON MODELİ Regresyon Y ile X (X ler) arasındaki ortalama ilişkinin matematik fonksiyonla ifadesidir. X’e bağlı olarak.
1 İ STATİSTİK II Tahminler ve Güven Aralıkları - 1.
1 KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller.
İSTATİSTİK II Örnekleme Dağılışları & Tahminleyicilerin Özellikleri.
OTOKORELASYON.
Bağımlı Kukla Değişkenler 1 Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla.
OLASILIK ve İSTATİSTİK
1 KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller.
DERS3 Prof.Dr. Serpil CULA
İKİ DEĞİŞKENLİ BASİT DOĞRUSAL REGRESYON MODELİ
Hatalarda Normal Dağılım
Farklı Varyans Var(ui|Xi) = Var(ui) = E(ui2) = s2  Eşit Varyans Y X.
Hatalarda Normal Dağılım
Öğr. Gör. Zeynep KÖSE Hasan Kalyoncu Üniversitesi İktisat Bölümü
Bağımlı Kukla Değişkenler
Bağımlı Kukla Değişkenler
Farklı Varyans Var(ui|Xi) = Var(ui) = E(ui2) = s2  Eşit Varyans Y X.
Tüketim Gelir
Bağımlı Kukla Değişkenler
İyi Bir Modelin Özellikleri
Bağımlı Kukla Değişkenler
Farklı Varyans Var(ui|Xi) = Var(ui) = E(ui2) = s2  Eşit Varyans Y X.
Normal Dağılımlılık EKK tahmincilerinin ihtimal dağılımları ui’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır. b tahminleri için uygulanan testlerin.
Sunum transkripti:

Bağımlı Kukla Değişkenler Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla değişkenler söz konusudur. Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır: -Doğrusal Olasılık Modeli -Logit Modeli -Probit Modeli -Tobit Modeli

Doğrusal Olasılık Modeli Yi = b1 + b2Xi +ui Yi= 1 Eğer i. Birey istenen özelliğe sahipse 0 Diğer Durumlarda Xi= Bağımsız değişken Bu modele olasılıklı model denmesinin nedeni, Y’nin X için şartlı beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır. E(Yi|Xi)=Pr(Yi=1| Xi)

Doğrusal Olasılık Modeli E(Yi |Xi)= b1 + b2Xi E(ui) = 0 Yi değişkeninin olasılık dağılımı: Yi Olasılık 0 1-Pi 1 Pi Toplam 1 E(Yi |Xi) = SYiPi=0.(1-Pi) + 1.(Pi) = Pi E(Yi |Xi)= b1 + b2Xi 0  E(Yi |Xi)  1

DOM Tahminindeki Sorunlar ui hata teriminin normal dağılmayışı: Normallik varsayımının sağlanmaması durumunda tahmin ediciler sapmasızlıklarını korurlar. Nokta tahminde normallik varsayımı gözardı edilir. Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla normal dağılıma uyarlar. DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı altındaki EKK sürecine uyarlar.

u’ların Binom Dağılımlı Olması EKKY varsayımlarından biri u değerlerinin dağılımının normal olmasıdır. Bu varsayım sayesinde katsayı tahminlerinin güven aralıkları hesaplanıp, test yapılabilmektedir. DOM’de u’lar normal dağılmaz, binom dağılımı gösterir: Y 1 ve 0 değerini aldığında Yi =1 için Yi =0 için u lar normal değildir. İki değerli binom dağılımlıdır. Ancak büyük örneklerde DOM güven aralıkları ve hipotez testleri geçerlidir ve EKKY normal dağılım varsayımının sağlandığı kabul edilmektedir.

ui hata teriminin değişen varyanslı olması: DOM’de u lar eşit varyanslı değillerdir. Bunun için kesikli bir Y değişkeni varyansından hareketle Y yerine u alınarak Yi ui İhtimal=P(ui) -b1-b2X (1-Pi) 1 1-b1-b2X Pi

ui hata teriminin değişen varyanslı olması: u’nun varyansı farklıdır. u’nun varyansı Y’nin X için şartlı beklenen değerine bağlıdır ve sonuçta u’nun varyansı X’in değerine bağlı olacak ve eşit olmayacaktır. ui hata teriminin değişen varyanslı olması: Var(ui) = Pi(1-Pi) DOM’nin EKKY ile tahmininde ortaya çıkan farklı varyans problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm getirmek mümkündür:

DOM’de Farklı Varyansı Önleme ler bilinmediğinden bunun yerine örnek tahmini değerleri hesaplanarak ifadesinde yerine konarak ler kullanılır. 0  E(Yi |Xi)  1 varsayımının yerine gelmeyişi DOM’de Y’nin şartlı olasılığını gösteren E(Y|X) nın 0 ila 1 arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.Bu şart anakütle için geçerlidir. Anakütlenin tahmincisi için geçerli olmayabilir. Tahmini şartlı olasılıklar 0 ile 1 olmayabilir: 8

0  E(Yi |Xi)  1 0 ile 1 arasında mıdır? DOM”, EKKY ile elde edildikten sonra Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için 0 değerini alır. 1’den büyük değerli ise bunlar için nin 1’e eşit olduğu kabul edilir. Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın kalktığı görülebilir. eşit varyanslıdır. Bu yöntem TEKKY’dir.

Doğrusal Olasılık Modeli Di = b1 + b2Mi +b3 Si +ui Di= 1 Eğer i. Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda Mi= 1 Eğer i. Kadın evliyse diğer durumlarda 0 Si = i.kadının yıl olarak aldığı eğitim Ai= i. Kadının Yaşı

Kadının İşgücüne Katılımı Modeli: Di Mi Ai Si 1 31 16 35 10 34 14 40 41 43 67 9 37 12 25 27 13 58 28 45 48 55 66 7 44 11 8 21 15 62 23 51 39 Kadının İşgücüne Katılımı Modeli: Di= 1 i.Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda Mi= 1 i. Kadın evliyse 0 diğer durumlarda Si = i.kadının yıl olarak aldığı eğitim Ai= i. Kadının Yaşı

Kadının İşgücüne Katılımı Modeli Mi= 1 Kadın evliyse ;0 diğer durumlarda ; Si = i.kadının yıl olarak aldığı eğitim A= Kadının Yaşı Di = b1 + b2Mi +b3 Si +ui Dependent Variable: DI Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. C -0.284301 0.435743 -0.652452 0.5196 MI -0.381780 0.153053 -2.494430 0.0190 SI 0.093012 0.034598 2.688402 0.0121 R-squared 0.363455 Mean dependent var 0.600000 Adjusted R-squared 0.316304 S.D. dependent var 0.498273 S.E. of regression 0.412001 Akaike info criterion 1.159060 Sum squared resid 4.583121 Schwarz criterion 1.299179 Log likelihood -14.38590 F-statistic 7.708257 Durbin-Watson stat 2.550725 Prob(F-statistic) 0.002247

White Heteroskedasticity Test: F-statistic 1.759076 Probability 0.168742 Obs*R-squared 6.589061 Probability 0.159265 Dependent Variable: RESID^2 Included observations: 30 Variable Coefficient Std. Error t- Statistic Prob. C -0.390620 0.700490 -0.557639 0.5821 MI -0.410659 0.315325 -1.302336 0.2047 MI*SI 0.036202 0.026225 1.380429 0.1797 SI 0.132421 0.116635 1.135344 0.2670 SI^2 -0.007102 0.004809 -1.476822 0.1522 R-squared 0.219635 Mean dependent var 0.15277 Adjusted R-squared 0.094777 S.D. dependent var 0.16180 S.E. of regression 0.153942 Akaike info criterion -0.75347 Sum squared resid 0.592452 Schwarz criterion 0.51994 Log likelihood 16.30209 F-statistic 1.75907 Durbin-Watson stat 1.963424 Prob(F-statistic) 0.16874

DOM’de Farklı Varyansı Önleme Dependent Variable: Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. -0.184154 0.316834 -0.581231 0.5659 -0.362893 0.135229 -2.683551 0.0123 0.081678 0.022231 3.674022 0.0010 R-squared 0.872710 Mean dependent var 2.190469 Adjusted R-squared 0.863281 S.D. dependent var 2.514662 S.E. of regression 0.929809 Akaike info criterion 2.786965 Sum squared resid 23.34273 Schwarz criterion 2.927085 Log likelihood -38.80448 F-statistic 92.55700 Durbin-Watson stat 2.583787 Prob(F-statistic) 0.000000

UYGULAMA:Cep telefonunun kullanılıp kullanılmamasını ifade eden bağımlı kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile açıklanmıştır.(Y=1, cep telefonuna sahip ise, Y=0 cep telefonuna sahip değilse) Kişi Y X(Gelir) Z(Yaş) 1 250 23 26 185 21 2 350 27 3 150 28 500 4 600 22 29 790 5 200 30 6 20 31 675 7 390 32 490 8 18 33 9 900 25 34 760 10 35 550 11 255 36 400 24 12 300 37 13 640 38 220 14 39 175 15 40 840 16 19 41 17 800 42 875 43 44 485 45 46 47 470 48 750 49 225 50 130

Included observations: 50 Y=1, cep telefonuna sahip ise, Y=0 cep telefonuna sahip değilse; X(Gelir); Z(Yaş) Dependent Variable: Y Method: Least Squares Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob. C -1.373086 0.585035 -2.347017 0.0232 X 0.000492 0.000259 1.900372 0.0635 Z 0.086130 0.026781 3.216041 0.0024 R-squared 0.2401 Mean dependent var 0.700 Adjusted R-squared 0.207770 S.D. dependent var0.462910 S.E. of regression 0.412024 Akaike info criterion1.122653 Sum squared resid 7.978889 Schwarz criterion 1.2373 Log likelihood -25.06633 F-statistic 7.425357 Durbin-Watson stat 1.552777 Prob(F-statistic)0.001577

White Heteroskedasticity Test: F-statistic 2.305076 Probability 0.060504 Obs*R-squared 10.37848 Probability 0.065195 Dependent Variable: RESID^2 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob. C 2.341377 2.147612 1.090224 0.2815 X -0.004404 0.001530 -2.878146 0.0062 X^2 1.63E-06 6.58E-07 2.475147 0.0172 X*Z 0.000132 6.84E-05 1.927924 0.0603 Z -0.116457 0.191111 -0.609369 0.5454 Z^2 0.001301 0.004396 0.295915 0.7687 R-squared 0.207570 Mean dependent var0.159578 Adjusted R-squared 0.117521 S.D. dependent var 0.225222 S.E. of regression 0.211574 Akaike info criterion -0.156314 Sum squared resid 1.969602 Schwarz criterion 0.073128 Log likelihood 9.907860 F-statistic 2.305076 Durbin-Watson stat 2.375111 Prob(F-statistic) 0.060504

Kişi   1 0.7308 16 0.5338 31 0.8536 46 0.4970 2 0.6077 17 0.5705 32 0.7627 47 0.4944 3 0.6817 18 0.8658 33 0.6815 48 1.0012 4 0.8167 19 0.3861 34 0.8093 49 0.5586 5 0.6201 20 0.5953 35 1.1367 50 0.6718 6 0.4233 21 0.5092 36 0.8907 7 1.1442 22 37 0.5340 8 0.2756 23 0.7922 38 0.5438 9 1.2226 24 0.8044 39 0.6939 10 0.2510 25 0.7185 40 0.8486 11 0.3026 26 0.5266 41 12 27 42 0.7062 13 1.0948 28 43 14 1.1982 29 0.9963 44 0.8463 15 0.6693 30 0.7676 45

Dependent Variable: Method: Least Squares Sample: 1 50 Included observations: 44 Excluded observations: 6 Variable Coefficient Std. Error t-Statistic Prob. -1.960127 0.591996 -3.311048 0.0019 0.000468 0.000170 2.754280 0.0087 0.114551 0.028194 4.062939 0.0002 R-squared 0.899751 Mean dependent var 1.9024 Adjusted R-squared 0.894861 S.D. dependent var 2.504969 S.E. of regression 0.812241 Akaike info criterion2.487706 Sum squared resid 27.04915 Schwarz criterion 2.609356 Log likelihood -51.72954 F-statistic 183.9907 Durbin-Watson stat 1.728717 Prob(F-statistic) 0.000000

DOM’e Alternatif Model Arama DOM ile ilgili sayılan sorunlar aşılabilir: DOM EKKY nin iki varsayımını yerine getirmez. Hatalar normal dağılımlı değildir ve farklı varyans söz konusu olabilir. En önemli problem DOM’nin Pi=E(Y=1|X) nin Xi ile doğrusal doğrusal olarak arttığını varsaymasıdır. Yani X’deki marjinal veya küçük bir artış hep sabittir. Gerçek hayatta ise bu, beklenen bir durum değildir.

DOM’e Alternatif Model Arama 0-1 aralığı dışına çıkmamak koşuluyla, öyle bir model bulunmalı ki Pi ile Xi arasındaki ilişki eğrisel olsun:Xi deki artışlar Pi yi de arttırsın. Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir: 1 P KDF X + - Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir. Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde kullanılabilir.

Logit Model Logistik Dağılım Fonksiyonu kümülatif lojistik dağılım fonksiyonudur. Bahis yada olabilirlik oranı Bu orana örneğin, ev sahibi olma lehine fark oranı denir. Lojistik modelin her iki tarafının doğal log. alındığında Li fark oranı logaritması olup hem X, hem parametrelere göre doğrusaldır.Z değişkeni - dan + a değişirken, P 0 ile 1 arasında değişir.

Logit Model Logit modelde olasılık iken. DOM’de şeklindedir.

Logit Model Zi, - ile + arasında değerler alırken Pi’nin aldığı değerler ise 0 ile 1 arasında değişmektedir. Zi ile Pi arasındaki ilişki doğrusal değildir.

Logit Modelin Özellikleri 1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -ile + arasında değer alır. Pi=1 = + Pi=0 = - 2. Logit, X’e göre doğrusal iken olasılıklara göre değildir. 3. Logit modelin b2 katsayısı; bağımsız değişkendeki bir birimlik değişme karşısında logitteki değişmeyi gösterir. 4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.

Logit Model Bir olayın gerçekleşme olasılığının birden büyük olması durumundan kaçınmak için olasılığın Z’nin S şeklinde bir fonksiyonu olduğunu varsaymaktır. Z, açıklayıcı değişkenlerin fonksiyonu olarak ifade edilebilir. 2

Logit Model Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve yukarıda gösterildiği gibi bunlardan biri de lojistik fonksiyondur. Z + sonsuza gideren, e-Z sıfıra gitmekte, ve p 1’e gitmektedir. (fakat 1’i geçmemektedir.). Z – sonsuza giderken, e-Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın altına inmemektedir.). 3

Logit Modelin EKKY İle Tahmini 1.Adım: olasılıkları hesaplanır. 2.Adım: fark oranı logaritmaları hesaplanır. 3.Adım: orijinal lojistik modeli tahminlenir. Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir.

Logit Modelin EKKY İle Tahmini Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. Dönüşümlü veya Tartılı EKK Lojistik Modeli

Logistik Model Uygulaması 300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (Xi) ve ev sahibi olanların sayısı (ni) aşağıdaki tabloda gösterilmiştir. X Milyon TL) Aile Sayısı= Ni Ev Sahibi Olan Aile Sayısı=ni Nispi Frekanslar Pi=ni/Ni 12 20 5 0.25 16 25 6 0.24 35 10 0.28 26 45 15 0.33 30 50 0.50 40 34 18 0.53 0.66 60 0.61 70 0.75 80 0.67 Ni = 300 ni = 140

Logistik Model Uygulaması Xi 1 12 16 20 26 30 40 50 60 70 80 Ni 2 20 25 35 45 50 34 30 26 15 ni 3 5 6 10 15 25 18 20 16 Pi 4=3/2 0.25 0.24 0.28 0.33 0.50 0.53 0.66 0.61 0.75 0.67 1-Pi 5=1-4 0.75 0.76 0.72 0.67 0.50 0.47 0.34 0.39 0.25 0.33 Pi /1- Pi 6=4/5 0.33 0.31 0.39 0.49 1.00 1.13 1.94 1.56 3.00 2.03 Li 7=ln(6) -1.1086 -1.1712 -0.9416 -0.7133 0.0000 0.1222 0.6626 0.4446 1.0986 0.7080

Logistik Model Uygulaması Dependent Variable: L Method: Least Squares Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C -1.409706 0.215776 -6.533192 0.0002 X 0.032669 0.004667 7.000011 0.0001 R-squared 0.859649 Mean dependent var -0.089870 Adjusted R-squared 0.842106 S.D. dependent var 0.835010 S.E. of regression 0.331799 Akaike info criterion 0.808280 Sum squared resid 0.880723 Schwarz criterion 0.868797 Log likelihood -2.041402 F-statistic 49.00015 Durbin-Watson stat 1 .582165 Prob(F-statistic) 0.000113

Logistik Model Uygulaması v=N.P.(1-P) 8=2.4.5 3.75 4.56 7.05 9.95 12.50 8.47 6.73 6.18 3.31 vi 9= 8 1.9365 2.1354 2.6552 3.1543 3.5355 2.9103 2.5942 2.4859 1.8193 L* 10=7.9 -2.1468 -2.5009 -2.5001 -2.4999 0.0000 0.3556 1.7189 1.1052 2.1274 1.2880 X* 11=1.9 23.2379 34.1666 53.1036 82.0134 106.0660 116.4130 129.7112 149.1576 135.5544 145.5472

Logistik Model Uygulaması Li*= -1.38056 vi + 0.03363 Xi*, s= 0.8421 s(bi): (0.2315) (0.00556) , R2= 0.80 t= (-5.9617) (6.0424) , d= 1.649, F= 36.95 Gelir bir birim arttığında, ev sahibi olma lehine fark oranının logaritması 0.033 artmaktadır. Bu fark oranına göre belli bir gelir seviyesinde ev sahibi olma olasılığı hesaplanabilir: X=40 iken değerleri yukarıdaki denklemde yerine konduğunda L*=-0.10288 bulunur. olabilirlik oranı

40 birim gelirli bir ailenin ev sahibi olma olasılığı %47.43’dür. Lojistik modelden, belli bir gelir seviyesinde gelirdeki bir birimlik artışın ev sahibi olma olasılığını ne ölçüde arttıracağı tahmin edilebilir: formülünden yararlanılır. X=40 iken gelir 1 birim arttığında ev sahibi olma olasılığı [0.03363(1-0.4743)0.4743]=0.00838(%0.8)

Bu verilerle ilgili Logit tahmin modeli aşağıdaki gibidir: UYGULAMA: Kasımpatı yaprak bitkilerini öldüren bir ilaçtan 1 Lt suya konan dozlar (X, Miligram), yaklaşık 50cl.’lik bit grupları(Ni) üzerine sıkılmış ve ölen bit sayısı (ni) aşağıdaki gibi tesbit edilmiştir: Doz(Litre başına mg) X Gruplardaki yaprak biti sayısı (Ni) Ölen (ni) Li 2.6 50 6 -1.99 3.8 48 16 -0.69 5.1 46 24 0.09 7.7 49 42 1.79 10.2 44 1.99 Bu verilerle ilgili Logit tahmin modeli aşağıdaki gibidir: 36

Dependent Variable: LI Method: Least Squares Included observations: 5 Variable Coefficient Std. Error t-Statistic Prob. C -2.850133 0.602091 -4.733723 0.0179 X 0.525044 0.092785 5.658686 0.0109 37

Katsayı tahminlerini yorumlayınız X=7.7 miligram doz seviyesinde ölüm ihtimali P’yi hesaplayınız. 38

Probit Model Bağımlı kukla değişkenli modellerden kümülatif lojistik fonksiyonundan farklı olarak, normal kümülatif dağılım fonksiyonunu kullanan PROBİT(NORMAL) model vardır. P R O B İ T (NORMAL) MODEL F(z)= Probit modeli şu şekilde tanımlayabiliriz: Herhangi bir i hanesinin ev sahibi olma veya olmama kararının gözlenemeyen bir fayda indeksi Ii’ye bağlı olduğunu varsayalım.

Ii, bağımsız değişkenlere bağlıdır. Örneğin Xi (gelir)değişkeni. Y=1 hane ev sahibi Y=0 hane ev sahibi değil. (1) Ii= b1 + b2 Xi Her hane için Ii’nın belli bir değerinden itibaren ev sahibi olma durumu söz konusudur.Ii değeri, Ii* değerini aştığı zaman hane, ev sahibi olacak aksi durumda olmayacaktır. Ii*  Ii  ifadesi, faydanın belli bir eşik değerinden sonra söz konusu olabileceğini gösterir. Ii* başlangıç değeri de Ii gibi gözlenemez. Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak Ii değerleri yukarıdaki regresyon denkleminden tahmin edilir. Tahminciler bulunur.

Normal dağılım varsayımıyla Ii Normal dağılım varsayımıyla Ii* ın Ii den küçük veya eşit olma olasılığı aşağıdaki standartlaştırılmış normal KDF ile hesaplanabilir: Pi=Pr(Y=1)=Pr(Ii* Ii)=F(Ii) (2) =Standartlaştırılmış Normal KDF =standartlaştırılmış normal değişken Pi=Bir ev sahibi olma olasılığı.

Probit Model Pi verilmişken, absiste Ii bulunur. Pi=F(Ii) 1 Pi Ii* <=Ii verilmişken ev sahibi olma olasılığı Pi ordinatta bulunur Ii= b1 + b2 Xi - + Pi=F(Ii) 1 Pi Pi verilmişken, absiste Ii bulunur. - Ii=F-1(Pi ) +

Ii = F-1(Ii)= F-1 (Pi)=b1+b2Xi Ii’yı bulabilmek için 2 no’lu ifadenin tersi alınmalıdır. Ii = F-1(Ii)= F-1 (Pi)=b1+b2Xi =Probit model F-1: normal kümülatif dağılım fonksiyonunun tersi.

Probit Modelin Tahmin Aşamaları Pi= ni/Ni hesaplanır. Ii = F-1 (Pi)= normal eşdeğer sapma bulunur. Ii = b1 + b2 Xi + ui EKK ile tahmin edilir. İstenirse, Ii yerine, (Ii + 5)=probit değerleri alınarak, EKKY ile (13.19) tahmin edilir. modelinin hata terimi ui farklı varyanslıdır. Bu sebepten dönüşümlü değerler alınarak TEKKY uygulanabilir:=

fi= F-1 (Pi) ifadesine eşit standart normal yoğunluk fonksiyonudur. 6. Büyük örnekler için bi'lerin güven aralıkları ve hipotez testleri uygulanarak, anakütlede durumun geçerliliği araştırılabilir. 7. Belirlilik katsayısı R2, modelin fonksiyonel biçiminin iyi seçilip seçilmediği konusunda bize fikir vermez.

Probit Model Uygulaması Pi 0.25 0.24 0.28 0.33 0.50 0.53 0.66 0.61 0.75 0.67 Ii=F-1(Pi) -0.6745 -0.7063 -0.5828 -0.4399 0.0000 0.0752 0.4124 0.2793 0.6745 0.4399 Probitler=Zi=(Ii+5) 4.3255 4.2937 4.4172 4.5601 5.0000 5.0752 5.4124 5.2793 5.6745 5.4399 Xi 12 16 20 26 30 40 50 60 70 80

Probit Model Uygulaması Ii= -0.8587 + 0.0200 Xi , r2= 0.8628 r= 0.9289 s(bi) (0.0028) s= 0.2 d= 1.59 t= (7.094) Zi= 4.1324 + 0.0201 Xi , r2= 0.8621 r= 0.9285 s(bi) (0.0028) s= 0.2 d= 1.5637 t= (7.071)

En Yüksek Olabilirlik Yöntemi İstatistikte, tüm anakütleler kendilerine karşılık gelen bir olasılık dağılımı ile tanımlanırlar. Basit(sıradan) en küçük kareler yöntemi, özünde olasılık dağılımları ile ilgili herhangi bir varsayım içermez. Bu yüzden, çıkarsama yapmada BEK tek başına bir işe yaramaz. BEK, genel bir tahmin yaklaşımından çok regresyon doğrularını bulmada kullanılabilecek bir hesaplama yöntemi olarak görülmelidir.

BEK yönteminden daha güçlü kuramsal özellikler gösteren bir başka nokta tahmincisi EYO, yani “en yüksek olabilirlik” (maximum likelihood) yöntemidir. En yüksek olabilirlik yönteminin ardında yatan temel ilke şu beklentidir: “Rassal bir olayın gerçekleşmesi, o olayın, gerçekleşme olasılığının en yüksek olay olmasındandır.” Bu yöntem, 1920’li yıllarda˙Ingiliz istatistikçi Sir Ronald A. Fisher (1890-1962) tarafından bulunmuştur. Ki-kare testi, bayesgil yöntemler ve çeşitli ölçüt modelleri gibi birçok istatistiksel çıkarım yöntemi, temelde EYO yaklaşımına dayanmaktadır.

EYO yöntemini anlayabilmek için, elimizde dağılım katsayıları bilinen farklı anakütleler ve rassal olarak belirlenmiş bir örneklem olduğunu varsayalım: Bu örneklemin farklı anakütlelerden gelme olasılığı farklı ve bazı ana kütlelerden gelme olasılığı diğerlerine göre daha yüksektir. Elimizdeki örneklem, eğer bu anakütlelerden birinden alınmışsa, “alınma olasılığı en yüksek anakütleden alınmış olmalıdır” diye düşünülebilir.

Kısaca: 1. Anakütlenin olasılık dağılımı belirlenir veya bu yönde bir varsayımda bulunulur. 2. Eldeki örneklem verilerinin, hangi katsayılara sahip anakütleden gelmiş olma olasılığının en yüksek olduğu bulunur. YALTA (2007 – 2008 Ders Notları)

Regresyon Katsayılarının En Yüksek Olabilirlik Tahminleri X Y Xi b1 b1 + b2Xi Y = b1 + b2X Y = b1 + b 2X + u modelinde katsayıların en çok olabilirlik tahminleri yapılmadan önce modelde hata terimi olmadığını ifade edelim. Nokta ile gösterilen yerde Y değerine karşılık gelen X değerinin Xi değerine eşit olduğunu görülmektedir. 1

X Y Xi b1 b1 + b2Xi Y = b1 + b2X Eğer modele hata terimini eklersek hataların belli bir ortalama ve varyansa bağlı olarak normal dağıldığını varsayabiliriz. 2

X Y Xi b1 b1 + b2Xi Y = b1 + b2X Şekilde gösterilen dağılış hata teriminin önceden tahmin edilen dağılışıdır. Gerçekte hata teriminin dağılışının belli bir değere bağlı olarak modelde normal dağıldığını varsayabiliriz. 3

X Y Xi b1 b1 + b2Xi Y = b1 + b2X Ayrıca yatay eksene göre bakıldığında; şekilde gösterilen dağılış X=Xi durumunda Y’nin tahmini dağılımını da ifade etmektedir. 4

X Y Xi b1 b1 + b2Xi Y = b1 + b2X Y değeri b1 + b2Xi e yaklaştıkça göreceli olarak daha yüksek yoğunluğa sahip olmaktadır. 6

Bununla birlikte b1 + b2Xi den uzaklaştıkça yoğunluk azalmaktadır. Y = b1 + b2X Bununla birlikte b1 + b2Xi den uzaklaştıkça yoğunluk azalmaktadır. 7

Regresyon Katsayılarının En Yüksek Olabilirlik Tahminleri X Y Xi b1 b1 + b2Xi Y = b1 + b2X Yi ‘nin ortalama değeri b1 + b2Xi ve hata terimlerinin standart sapması da s, olduğunu varsayarsak. 8

Regresyon Katsayılarının En Yüksek Olabilirlik Tahminleri X Y Xi b1 b1 + b2Xi Y = b1 + b2X Yi ’lerin olasılık yoğunluk fonksiyonları f(Yi) fonksiyonu ile ifade edilebilir. 9

İki Değişkenli Basit Regresyon Modelinin En Yüksek Olabilirlik Yöntemi İle Tahmini Tek denklemli ekonometrik modellerin tahmininde EKKY dışında kullanılan alternatif yöntem En Yüksek Olabilirlik Yöntemidir. Büyük örneklerde her iki yöntemde yakın sonuçlar vermektedir. Küçük örneklerde ise EYOBY’de olup sapmalıdır. EKKY’de ise sapmasızdır.

EYOBY’’nin regresyon modeline uygulanışı şöyledir: Y bağımlı değişkeninin ortalamalı varyanslı normal ve Yi değerlerinin bağımsız dağıldığı varsayılmaktadır. Yani (1)

Bu ortalama ve varyansla Yi nin Y1, Y2,…,Yn değerlerinin bileşik olasılık yoğunluk fonksiyonu şöyledir: Y’ler birbirinden bağımsız olduğundan, bu bileşik olasılık yoğunluk fonksiyonu, n tane bireysel yoğunluk fonksiyonunun çarpımı olarak yazılabilecektir. (2) (2) deki f(Yi), (1) deki ortalama ve varyanslı normal dağılımlı yoğunluk fonksiyonu olup şöyle ifade edilir:

(3) (3)’ü (1) deki her Yi yerine koyarak aşağıdaki ifadeyi elde ederiz: (4) Ortak yoğunluk fonksiyonları her bir yoğunluk fonksiyonunun çarpımına eşittir. (4) de Yi ler bilindiğinde ve b1,b2 ve s2 ler bilinmediğinde (4) ifadesine en yüksek olabilirlik fonksiyonu adı verilir ve L(b1,b2,s2) şeklinde gösterilir.

(5) En yüksek olabilirlik yöntemi bilinmeyen bi parametrelerinin, verilen Y’nin gözlenme olasılığının ençok(maksimum) olacak tarzda tahmini esasına dayanır. Bu sebepten b’lerin EYOBY’ ile tahmin için (5) fonksiyonunun maksimumunun araştırılması gerekir. Bu türevdir, türev için en kısa yol (5) in log. nın alınmasıdır.

Wooldridge Example 17.1 inlf kidslt6 kidsge6 age educ exper nwifeinc expersq   Obs: 753 1. inlf =1 işgücüne katılıyorsa 2. kidslt6 6 < yaşında küçük çocuk sayısı 3. kidsge6 6-18 yaşları arasındaki çocuk sayısı 4. age kadının yaşı 5. educ eğitim yılı 6. exper deneyim 7. nwifeinc (ailegeliri – ücret*saat)/1000 8. expersq deneyimkare

Wooldridge Example 17.1-DİM Dependent Variable: INLF Method: Least Squares Included observations: 753 Variable Coefficient Std. Error t-Statistic Prob. NWIFEINC -0.003405 0.001448 -2.350840 0.0190 EDUC 0.037995 0.007376 5.151194 0.0000 EXPER 0.039492 0.005673 6.961866 0.0000 EXPERSQ -0.000596 0.000185 -3.226959 0.0013 AGE -0.016091 0.002485 -6.476014 0.0000 KIDSLT6 -0.261810 0.033506 -7.813888 0.0000 KIDSGE6 0.013012 0.013196 0.986077 0.3244 C 0.585519 0.154178 3.797683 0.0002 R-squared 0.264216 Mean dependent var 0.568393 Adjusted R-squared 0.257303 S.D. dependent var 0.495630 S.E. of regression 0.427133 Akaike info criterion 1.147124 Sum squared resid 135.9197 Schwarz criterion 1.196251 Log likelihood -423.8923 F-statistic 38.21795 Durbin-Watson stat 0.493840 Prob(F-statistic) 0.000000

Wooldridge Example 17.1-LOGİT Dependent Variable: INLF Method: ML - Binary Logit Included observations: 753 Variable Coefficient Std. Error z-Statistic Prob. NWIFEINC -0.021345 0.008421 -2.534621 0.0113 EDUC 0.221170 0.043440 5.091443 0.0000 EXPER 0.205870 0.032057 6.422002 0.0000 EXPERSQ -0.003154 0.001016 -3.104093 0.0019 AGE -0.088024 0.014573 -6.040235 0.0000 KIDSLT6 -1.443354 0.203585 -7.089695 0.0000 KIDSGE6 0.060112 0.074790 0.803750 0.4215 C 0.425452 0.860369 0.494500 0.6210 Mean dependent var 0.568393 S.D. dependent var 0.495630 S.E. of regression 0.425963 Akaike info criterion 1.088354 Sum squared resid 135.1762 Schwarz criterion 1.137481 Log likelihood -401.7652 Hannan-Quinn criter. 1.107280 Restr. log likelihood -514.8732 Avg. log likelihood -0.533553 LR statistic (7 df) 226.2161 McFadden R-squared 0.219681 Probability(LR stat) 0.000000 Obs with Dep=0 325 Total obs 753 Obs with Dep=1 428

Wooldridge Example 17.1-PROBİT Dependent Variable: INLF Method: ML - Binary Probit Included observations: 753 Variable Coefficient Std. Error z-Statistic Prob. NWIFEINC -0.012024 0.004840 -2.484327 0.0130 EDUC 0.130905 0.025254 5.183485 0.0000 EXPER 0.123348 0.018716 6.590348 0.0000 EXPERSQ -0.001887 0.000600 -3.145205 0.0017 AGE -0.052853 0.008477 -6.234656 0.0000 KIDSLT6 -0.868329 0.118522 -7.326288 0.0000 KIDSGE6 0.036005 0.043477 0.828142 0.4076 C 0.270077 0.508593 0.531027 0.5954 Mean dependent var 0.568393 S.D. dependent var 0.495630 S.E. of regression 0.425945 Akaike info criterion 1.087124 Sum squared resid 135.1646 Schwarz criterion 1.136251 Log likelihood -401.3022 Hannan-Quinn criter. 1.106050 Restr. log likelihood -514.8732 Avg. log likelihood -0.532938 LR statistic (7 df) 227.1420 McFadden R-squared 0.220581 Probability(LR stat) 0.000000 Obs with Dep=0 325 Total obs 753 Obs with Dep=1 428

UYGULAMA: Aşağıda bir okulun eğitimi ile ilgili verileri kullanarak Probit denklemini çıkartınız. GRADE: Yeni bir tekniğin uygulanması sonucu öğrencilerin başarısı PSI: Yeni Bir Ekonomi Öğretme Yöntemi GPA: Ortalama Derece TUCE: Sınav Öncesi Konu ile ilgili Bilgi SKoru

Dependent Variable: GRADE Method: ML - Binary Probit Included observations: 32 Convergence achieved after 5 iterations Variable Coefficient Std. Error z-Statistic Prob. C -7.452320 2.542472 -2.931131 0.0034 GPA 1.625810 0.693882 2.343063 0.0191 PSI 1.426332 0.595038 2.397045 0.0165 TUCE 0.051729 0.083890 0.616626 0.5375

Dependent Variable: GRADE Method: ML - Binary Logit Sample: 1 32 Variable Coefficient Std. Error z-Statistic Prob. C -13.02135 4.931317 -2.640541 0.0083 GPA 2.826113 1.262940 2.237726 0.0252 PSI 2.378688 1.064563 2.234426 0.0255 TUCE 0.095158 0.141554 0.672235 0.5014

Kadının İşgücüne Katılımı Modeli: Di Mi Ai Si 1 31 16 35 10 34 14 40 41 43 67 9 37 12 25 27 13 58 28 45 48 55 66 7 44 11 8 21 15 62 23 51 39 Kadının İşgücüne Katılımı Modeli: Di= 1 i.Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda Mi= 1 i. Kadın evliyse 0 diğer durumlarda Si = i.kadının yıl olarak aldığı eğitim Ai= i. Kadının Yaşı 75

Logit Model Tahminleri Dependent Variable: DI Method: ML - Binary Logit Included observations: 30 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-Statistic Prob. C -5.895933 3.324731 -1.773356 0.0762 MI -2.586110 1.180162 -2.191318 0.0284 SI 0.690368 0.315828 2.185899 0.0288 Mean dependent var 0.600000 S.D. dependent var 0.498273 S.E. of regression 0.399177 Akaike info criterion 1.085128 Sum squared resid 4.302237 Schwarz criterion 1.225248 Log likelihood -13.27693 Hannan-Quinn criter. 1.129954 Restr. log likelihood -20.19035 Avg. log likelihood -0.442564 LR statistic (2 df) 13.82685 McFadden R-squared 0.342412 Probability(LR stat) 0.000994 Obs with Dep=0 12 Total obs 30 Obs with Dep=1 18