TOBİT MODELLER
Sansürlenmiş ve Kesikli Regresyon Modelleri… Sınırlı bağımlı değişkenler: sansürlenmiş (censored) ve kesikli (truncated) regresyon modelleri şeklinde iki gruba ayrılır.
…Sansürlenmiş ve Kesikli Regresyon Modelleri… Sansürlenmiş örneklem, bağımsız değişkenin bilinen değerlerine karşılık, bağımlı değişkenin gözlemlerinin bazılarının gözlenememesidir. Örneğin ücret haddini belirleyen etkenler ile ilgili bir araştırmada çalışan bireylere ait açıklayıcı veriler tanımlanabilirken, çalışmayan bireylerin için herhangi bir ücret haddi gözlenemez.
…Sansürlenmiş ve Kesikli Regresyon Modelleri… Orijinal Gözlemler Birey yas eglence 1 49 129.0968 2 39 919.3548 3 52 4 60 48.3871 5 75 6 42 7047.009 7 26 8 65 9 40 4380.906 10 50 11 67 4577.039 12 830.7553 13 31 14 29 211.5408 15 61 16 279.5166 17 35 1480.242 18 36 1631.42 19 44 1812.689 20 54 2009.003 Sansürlü Gözlemler yas eglence 52 75 26 65 50 31 61 60 48.3871 49 129.0968 29 211.5408 279.5166 42 830.7553 39 919.3548 35 1480.242 36 1631.42 44 1812.689 54 2009.003 40 4380.906 67 4577.039 7047.009 Kesikli Gözlemler yas eglence - 60 48.3871 49 129.0968 29 211.5408 50 279.5166 42 830.7553 39 919.3548 35 1480.242 36 1631.42 44 1812.689 54 2009.003 40 4380.906 67 4577.039 7047.009
Probit modeli için bağımlı değişken Orijinal Gözlemler Birey yas eglence Probit modeli için bağımlı değişken 1 49 129.0968 2 39 919.3548 3 52 4 60 48.3871 5 75 6 42 7047.009 7 26 8 65 9 40 4380.906 10 50 11 67 4577.039 12 830.7553 13 31 14 29 211.5408 15 61 16 279.5166 17 35 1480.242 18 36 1631.42 19 44 1812.689 20 54 2009.003 Eğer eglence>0, bağımlı değişken 1 değerini almaktadır.
Orijinal Gözlemler egitim telefon ceptel bilgisay 8 1 4 2 11 Sansürlü Gözlemler egitim telefon ceptel bilgisay 1 2 8 4 11 Kesikli Gözlemler egitim telefon ceptel bilgisay - 8 1 4 2 11
Probit modeli için bağımlı değişken Orijinal Gözlemler egitim telefon ceptel bilgisay Probit modeli için bağımlı değişken 8 1 4 2 11 02 Eğer egitim>0 ise, bağımlı değişken 1 değerini almaktadır.
…Sansürlenmiş ve Kesikli Regresyon Modelleri… Kesikli örneklem, bağımsız değişkenin değerlerinin ancak bağımlı değişken gözlenebilir iken tanımlanmasıdır. Kesikli örnekte bağımlı değişkenin verisinin örneğin 100’den küçük olduğu tüm durumlar çıkarılır. Kesme işlemi örneklemi değiştirirken, sansürleme örneklemi değiştirmez. Örneğin tamamındaki bağımsız değişkenler gözlendiğinde sansür ortaya çıkmaktadır. Sansürlü regresyon modeline Tobit model denir.
…Tobit Modeli… Belirli bir dönemde bireylerin dayanıklı tüketim malları veya otomobil üzerine harcamalarının sıfır değeri aldığı görülebilir. Sadece, pozitif değerler alan bağımlı değişkenli doğrusal regresyon modelleri probit modellere benzerliğinden dolayı tobit modeller olarak bilinmektedir. Bağımlı değişkenin, değişim aralığının herhangi bir şekilde sınırlandırıldığı regresyon modellerinde eğer belirli bir aralığın dışındaki gözlemler tamamen kaybediliyorsa kesikli model, ancak en azından bağımsız değişkenler gözlenebiliyorsa sansürlü model söz konusu olmaktadır.
…Tobit Modeli… Bir konserin biletlerine olan talebi modellemede sahip olunan veri: satılan biletlerin sayısı kadardır, eğer konser kapalı gişe oynarsa talep, mevcut maksimum bilet sayısını aşar ve biletlere olan talep, mevcut biletlerin maksimum sayısı ile sansürlenir. Bu gibi durumlarda Tobit model kullanılır.
…Tobit Modeli… Probit ve logit modellerde gözlenen bir kukla değişken, (1) şeklindedir. i =1,…,T biçimindeki regresyon modelinde,
…Tobit Modeli… (2) (2) no’lu Tobit Modelinde olduğunda üzerinde bazı gözlemler sıfır değerini almaktadır. modelinde negatif veya sıfır değerini alan yi gözlemleri ihmal edildiğinde, ui>-bXi için gözlemlerin modele katılması ile ui hata terimi sıfır ortalamaya sahip olamaz.
…Tobit Modeli… Bu nedenle ui ortalaması sıfırdan farklı bir kesikli normal dağılıma sahiptir. Böylece olur ve bu ifadeTobit modelini verir.
(3) nolu Tobin’in Tobit Modelinde yt bir görünmeyen değişken, Xt açıklayıcı değişkenlerin bir vektörü, parametreler vektörüdür. et, normal özdeş ve bağımsız olarak dağılmış rassal kalıntı değişkenidir. Yt gözlenen bağımlı değişken ve L sansürlenen noktadır.
…Tobit Modeli… Veriler belirli bir limitin altında veya üstünde sınırlandırıldığında, örneklem verilerine uygulanan dağılım, sürekli ve süreksiz dağılımların bir karması olur. Bağımlı değişken kesikli hale getirildiğinde, belirli bir aralıktaki değerler tamamen tek bir değere dönüştürülür.
…Tobit Modeli… Tobit modeller için hata terimlerinin normal dağıldığı (veya genel olarak parametrik biçimli dağılım fonksiyonuna sahip olduğu) bilindiğinde maksimum benzerlik ve diğer benzerlik bazlı süreçler, tutarlı ve asimptotik olarak normal dağılımlı tahmin edicileri verir. Bununla beraber, benzerlik fonksiyonunun varsayılan parametrik biçimi yanlış belirlendiğinde tahmin ediciler tutarsız olur. Tobit model, belirli bir değerde sansürlenmiş normal sürekli bir bağımlı değişkeni kullanır.
…Tobit Modeli… Tobit analizde katsayılarının yorumu şöyledir: Sürekli bağımsız değişken için tüm değişkenler sabit iken x’deki bir birim artış y’de kadar beklenen bir değişme yapar. Bağımsız değişken kukla değişkenli ise; “diğer tüm değişkenler sabit iken x değişkenine sahip olma, y’nin beklenen değerini kadar değiştirir” denir.
…Tobit Modeli… Harcamanın negatif olamayacağı gerçeğinden hareketle dayanıklı tüketim malları üzerinde çalışan Tobin, hanehalkı harcamalarını analiz etmiştir. Çalışmada dayanıklı tüketim malları harcaması, hanehalkı geliri belirli bir düzeyi aşana kadar sıfır kabul edilmiştir. Başka bir örnek emek arzı, ücret oranı belirli bir düzeyi geçene kadar sıfır olarak alınmıştır.
…Tobit Modeli… Bir ailenin tatile çıkması durumunda ailede bulunan birey sayısı ne kadar fazla ise yapılan harcamanın da o kadar büyük olması beklenir. Buna karşılık, aileyi oluşturan birey sayısı ne kadar fazla ise ailenin tatile çıkma olasılığı da o kadar azdır.
…Tobit Modeli… Kısacası, tatile çıkıp çıkmamayı belirleyen denklem ile tatilde ne kadar harcama yapılacağını belirleyen denklem birbirinin aynısı değildir. Ampirik modelleme süreci bu farklı iki durumu yakalamalıdır. Bunlardan bir tanesi tatile çıkıp çıkmama ve diğeri de tatilde ne kadar harcama yapılacağı ile ilgilidir. Tobit modelinin bu durumu yansıtacak şekilde genelleştirilmesi gerekir.
Teorik Olarak Sansürleme Sorunu… y*, sansürlenmemiş bağımlı değişken olsun. Şekil 1’in A paneli: y*’ın verilen değerinin sıklık oranını gösteren eğrinin yüksek olduğu yerdeki y* dağılımını göstermektedir. y* 1 olduğunda, taralı bölgeye karşılık gelen y* değeri bilinmiyorsa, o zaman, y* gözlemlenemeyen ancak görülmez olarak var olduğu bilinen bir değişken (latent variable) olarak kabul edilir. Sansürlü y değişkeni (1) denkleminde gösterilen şekilde tanımlanır.
Teorik Olarak Sansürleme Sorunu… y* 1 y*, sansürlenmemiş bağımlı değişken
Teorik Olarak Sansürleme Sorunu… B Paneli: Sıfırda yığılmış sansürlü durumlardaki sansürlü y değişkenini göstermektedir. Buradaki çubuk, Panel A’daki gölgelendirilmiş bölgedeki durumları içermektedir. C Paneli : Panel A’daki gölgeli bölgenin basitçe silinmiş hali olan kesikli y|y>1 (yani verilen y, 1’den büyük, y>1) değişkeninin şemasıdır.
Teorik Olarak Sansürleme Sorunu… Sansür ve kesmenin doğrusal regresyon modelini etkileyip nasıl değiştirdiğini görmek için, doğrusal regresyon modelinin Şekil 2’de A Paneli sansürsüz 200 örneği göstermiş olsun.
Teorik Olarak Sansürleme Sorunu… sansürsüz 200 örnek Şekil 2 EKKY X Şekil 2 Buradaki kalın çizgi en küçük kareler ile tahmin edilen modeldir. Sansür çizgisinin altındaki verilerinde dahil olduğu tüm veriler ile çalışılmaktadır.
Teorik Olarak Sansürleme Sorunu… Şekil 3
Teorik Olarak Sansürleme Sorunu… Panel B’de: 1’e eşit ya da 1’den düşük olan y* değerleri, sansürlü durumlarda y=0 ile sansürlenmiştir. Panel A’da sansür çizgisinin altındaki değerler bilinirken, burada söz konusu değerler sıfırla sansürlenmiştir. Bunlar küçük üçgenlerle gösterilmiştir. Parametreleri tahmin etmenin bir yolu sıfırlı bilgilerin de olduğu sansürlü verilerle y’nin x’e göre regresyonuna en küçük kareler yöntemi uygulamaktır.
Teorik Olarak Sansürleme Sorunu… Ortaya çıkan sonuç, Şekil 3’de görülen Panel B’deki uzun atılımlı çizgidir. Burada sabit terimin eksik ve eğimin ise aşırı tahminlenmesi durumu ortaya çıkmaktadır. Bu tür yaklaşım tutarsız tahmincilere yol açmaktadır.
Teorik Olarak Sansürleme Sorunu… Sansürlü gözlemler problemlere yol açtığından, sansürlenmiş bağımlı değişken durumlarından kaçınmak için örneklemin kesildikten sonraki regresyonunu tahmin etmek için yine en küçük kareler kullanılabilir. Bu durumda sansür sorunu, kesikli örnek sorununa dönüşmektedir.
Teorik Olarak Sansürleme Sorunu… y=0 olduğu durumları attıktan sonra kesikli model en küçük kareler ile olarak tahminlenmektedir. Bu tahmin sabit terimi aşırı, eğim katsayısını eksik tahmin eder. Bu durum Şekil 3’de kısa eğimli çizgiyle görülmektedir. Kesikli modelde x ile e arasındaki ilişki tutarsız tahminlere yol açar.
Tobit Modellerde Sansürleme Sorunu… Tobit modeli tahmin etmede üçüncü yaklaşım, sansürlü regresyon modelidir. Tobit modeli, sansürlü bilgiyi de içeren tüm verileri kullanmakta ve tutarlı parametrelerin tahminlenmesini sağlamaktadır. Tobit modelde en çok benzerlik tahminleri koyu çizgiyle gösterilmiştir(Şekil 3). Bu çizgi sansürün olmadığı Panel A’daki tahminlere (onları belirten çizgiden) benzerdir.
Sansürlü Sonuçlarda Tobit Modeli… Tobit modelde ei ~ N (0, s2) olduğunda denklem yapısı şöyledir: (4) t:eşik değeri x’ler her durumda gözlemlenmektedir. y* ise; eşik değeri olan t’dan daha büyük değerlerde görülen, t’ya eşit yada daha küçük değerlerde sansürlenen, görünmeyen bir değişkendir.
Sansürlü Sonuçlarda Tobit Modeli… Gözlemlenen y, aşağıdaki denklem ile tanımlanır: (5) (4) ve (5) denklemlerinin birleştirilmesi ile: (6) Yukarıdaki modellerde bir sansürleme olması durumunda Tobit modeli kullanılabilir.
…Sansürlü Sonuçlarda Tobit Modeli… Örnek: 100.000 $ ve fazla olan gelirlere sansür konursa bu durumda Tobit modeli şöyle gerçekleşecektir: (7)
Tobit ve Probit Arasındaki Bağlantı Tobit ve Probitin yapısal modelleri benzer ancak modeller birbirinden farklıdır. Tobit modelinde y*> t iken bağımlı değişkenin gözlenen değerleri bilinmektedir. Probit modelinde sadece y*> t ise y bir değerini almaktadır. Ancak veriler eşiğin (t) altında ise bilinmemektedir ve y sıfır kabul edilmektedir. Tobit modeli hakkında daha fazla bilgi mevcuttur.Tobit modelden elde edilen katsayı tahminlerinin, Probit modelden elde edilenden daha etkin çıkması beklenmektedir.
Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Bir Monte Carlo deneyi için elde edilen regresyon modeli aşağıdadır: Burada X, 11 ile 60 arasında değişen tam sayılardan oluşmaktadır. Hata terimi u ise, ortalaması 0, standart sapması 10 olan normal dağılmış bir şans değişkenidir. Eğer Y sınırlanmamış ise, tüm gözlemler Şekil 4’deki gibidir. (8)
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Şekil 4
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Y değişkeni için negatif değerler alınmaz ve sıfır sınırı konursa, gözlemler Şekil 5’deki gibi değişikliğe uğrar. Şekil 5
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… EKKY ile elde edilen regresyon modelinde, Y değişkeni için negatif değerler alınmadığı ve bunun yerine 0 değerleri alındığı için tutarsız tahminler elde edilir. Böylece tahminci aşağı doğru eğim gösteren bir sapmaya sahip olurken, sabit terim de yukarı doğru sapmalı elde edilecektir. Bunun çözümü, sadece sınırlandırılmamış gözlemlerin bir alt örneklemi ile mümkün olmaktadır. Fakat bu durumda bile EKK tahmincileri sapmalı olacaktır.
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Yi>0 olduğu durumda model: –40 + 1.2Xi + ui > 0 (9) şeklinde elde edilir. Buradan; ui > 40 – 1.2Xi (10) bulunur.
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… ui’nin dağılımı kesikli bir dağılımdır. ui’nin beklenen değeri pozitif ve Xi’nin negatif bir fonksiyonu olacaktır. ui ile Xi arasında negatif bir ilişki olduğundan Gauss-Markov teoremi çiğnenecek ve EKK tahmincileri tutarsız olacaktır. Şekil 6
Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Şekil 7’de bu ilişkinin etkisi açıkça görülmektedir. X’in en düşük dört gözlem değerine karşılık gelen hata terimlerinin (dört hata terimi) değerleri pozitiftir. Y’yi pozitif yapmak için yeterli büyüklükte olacaklardır. Ancak, stokastik olmayan Y bileşimini pozitif yapacak kadar büyük değerlerin bulunduğu aralıkta, büyük negatif değerlere sahip olan hata terimli gözlemler atılmıştır.
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Şekil 7’de bu üç negatif hata teriminin değerleri daire şeklinde görülmeltedir. Bunun EKK’deki etkileri, sabit terimin olduğundan büyük ve eğimin olduğundan küçük tahminlenmesi şeklinde olacaktır Şekil 7
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Eğer normal dağılıma sahip bir hata terimi elde edildiği varsayılırsa, bu problemin tek çözümü, regresyon analizi ile probit analizinin birleşiminden oluşan en çok benzerlik tahmin tekniği olarak bilinen tobit analizini kullanmaktır. Hanelerin ihtiyaçları için yapmış olduğu harcamalar, Tüketici Harcamaları Anketi veri setinden bir örnek alınarak incelenecektir.
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Şekil 8’de hanehalkı ihtiyaç harcamaları (HEQ) ile toplam hanehalkı harcamaları (EXP) grafik olarak gösterilmiştir. 869 haneden 86 hanenin hanehalkı ihtiyaçları harcaması sıfır değerini almıştır, yani bu haneler hanehalkı ihtiyaçları için hiçbir harcamada bulunmamışlardır.
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Hanehalkı İhtiyiaçları Harcaması ($) Hanehalkı Harcaması ($) Şekil 8
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Aşağıda bu verilere uygulanan tobit regresyon sonucu verilmiştir: HEQ= -661,8156 + 0,0520828 EXP (11) s(bi) (97,95977) (0,0027023) t (-6,756) (19,273) Prob (0,0000) (0,0000) N: 869 chi2 (Prob): 315,41 (0,0000) Pseudo R2: 0,0223 Log Likelihood: -6911,0175 Gözlemler için özet sonuç: HEQ<=0’da soldan-sansürlü 86 gözlem Sansürlenmiş 783 gözlem
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Eğer bu verilerden önce sıfır değerli gözlemleri içeren (N=869) modele EKKY uygulanırsa eğim katsayısı 0.0472 sonrasında da sıfır değerli gözlemleri içermeyen veri seti (N=783) alınıp EKKY uygulanırsa, eğim katsayısı 0.0468 olarak bulunacaktır. Tobit modelde eğim katsayısını 0.052 bulmuştu.
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Her iki tahmin edilen eğim katsayıları beklendiği şekilde tobit tahmini ile bulunan eğim katsayılarından daha düşük değerli elde edilmiştir. Bu durumda aradaki fark sadece %10 kadar bir sınırdadır. Bu da Tobit ve EKKY tahminleri arasında çok düşük bir fark olduğunu gösterir.
…Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Eğer hata terimi normal dağılımlı değilse ve değişen varyans varsa Tobit regresyon uygulandığında tutarsız tahminciler elde edilecektir. Şekil 8’den de görüldüğü üzere, örnekteki gözlemler değişen varyansa neden olmaktadır. Bu da bağımlı değişkenin hanehalkı ihtiyaçları harcamasının, hanehalkı toplam harcamasının oranı olarak uygulanmasıyla muhtemelen ortadan kaldırılabilir.
Seçim Yanlılığı… Regresyon modelleri tahminlerinde örneklemenin yaklaşık olarak tesadüfi yapıldığı varsayılmaktadır. Bu konuda yakın geçmiş literatür incelendiğinde tesadüfi olmadan seçilen örneklemler için regresyon model tahminlemenin önemli bir yer oluşturduğu görülmektedir. Örneklem tesadüfi olsa bile bağımlı değişken kayıp değerler içeriyorsa seçim yanlılığından bahsedilebilir.
…Seçim Yanlılığı… Ekonometride ihmal edilen değişkenler veya spesifikasyon hatası için alışılmış analizlerin aksine örnek seçim yanlılığı analizinde, spesifikasyon hatasını arttıran değişkenlerin tahmin edilmesi bazen mümkündür. Uygulamada, seçim yanlılığı iki nedenle ortaya çıkabilir. Birincisi, kişilerin bireysel seçimlerinden veya incelenen veri birimlerinden, ikincisi ise analistlerin ya da veri işlemcilerin kişisel örnek seçim kararlarından kaynaklanabilir.
… Seçim Yanlılığı… Bireysel seçim sapması konusunda bir çok örnek vardır. Evli kadınların işgücüne katılımlarında, kadınların bazıları piyasa ücretleri, ev ücretlerini (rezervasyon ücretlerini) geçtiği zaman işgücüne katılmayı tercih edecektir. Eğer sadece çalışan evli kadınların ücretleri incelemeye alınırsa burada seçim yanlılığı yapılmış olacaktır.
… Seçim Yanlılığı… Benzer olarak, sendikalı ve sendikasız çalışan bireylerin olduğu veri grubunda sendikanın ücretlere olan etkisini tahminlemede de seçim yanlılığı söz konusudur. Eğer sadece sendikalı bireylerin ücretleri incelemeye alınırsa burada da seçim yanlılığı yapılmış olacaktır. Ayrıca sadece göç edenlerin ücretleri analiz edildiğinde, göç etmemiş olanların göç etmiş olmaları durumunda kazanabilecekleri ücretlerin güvenilir bir tahmini olamaz.