Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

1 KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller.

Benzer bir sunumlar


... konulu sunumlar: "1 KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller."— Sunum transkripti:

1 1 KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller) Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler

2 2 Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın. Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri) Birleştirilmiş DenklemYıllık Okul Harcaması =  1 +  2  ML + u ML = 0 Devlet Lisesi Yıllık Okul Harcaması =  1 ML= 1 Meslek Lisesi Yıllık Okul Harcaması =  1 +  2

3 3 1 Devlet Lisesi Meslek Lisesi  11 ML = 0 Devlet Lisesi ML= 1 Meslek Lisesi Yıllık Okul Harcaması = b 1 + b 2 ML + u

4 4 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER KUKLA DEĞİŞKENLERİN DİĞER KANTİTATİF DEĞİŞKENLERLE ALINDIĞI MODELLER (KOVARYANS ANALİZİ MODELLER) Harcama:Okul harcaması N:Öğrenci sayısı Bu kukla değişkenlerin açıklayıcı değişken olarak regresyon denkleminde nasıl yer aldıkları incelenecektir.

5 5 Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın. Meslek lisesindeki öğrenciler belirli meslek dallarında yetenek sahibi olmaya çalışırken her meslek grubuna özgü gerekli olan araç ve gereçlerin temini için devlet lisesinde okuyan öğrencilere göre yıl içerisinde daha fazla harcama yapmaları gerekmektedir. Her iki lisede okuyan öğrencilerin harcamaları arasındaki farkı görmek için birinci yol iki grup içinde ayrı ayrı regresyon denklemi oluşturmaktır. Bununla birlikte iki ayrı regresyon denklemi kurmanın bazı sakıncaları olmaktadır. Bu sakıncalardan bir tanesi; büyük bir anakütle ile çalışmak yerine ayrı ayrı küçük örneklemler ile çalışmak katsayı tahminlerinin doğruluğu üzerinde ters etki olmasına neden olacaktır.

6 6 OCC = 0 Devlet LisesiHarcama =  1 +  2 N + u OCC = 1 Meslek Lisesi Harcama=  1 ' +  2 N + u İki lise harcamaları arasındaki fark için diğer bir yol ise ; meslek lisesi harcama denkleminin sabit terimi  1 ' in devlet lisesinden daha büyük olduğunu varsayan bir hipotez kurmaktır. 11 1'1' Aslında, bu varsayım ile her iki lise için yıllık marjinal maliyetlerin aynı fakat sabit maliyetlerin farklı olduğu varsayımı yapılmaktadır. Marjinal maliyet varsayımı görünüşte makul gözükmese de, bu varsayım anlatımı kolaylaştırmak için yapılmaktadır.

7 7   İki sabit terim arasındaki fark olarak tanımlanabilir:  =  1 ' -  1. 11 1'1' Devlet LisesiHarcama =  1 +  2 N + u Meslek Lisesi Harcama =  1 ' +  2 N + u

8 8  1 ' =  1 +  olacaktır ve meslek lisesine ait harcama fonksiyonu aşağıdaki gibi yazılabilir: OCC = 0 Devlet LisesiHarcama =  1 +  2 N + u OCC = 1 Meslek LisesiHarcama =  1 +  +  2 N + u  =  1 ' -  1 idi. Artık iki harcama fonksiyonunu birleştirip kukla değişken ML oluşturulabilir. ML öğrenci devlet lisesine gidiyor ise 0 değerini, meslek lisesine gidiyor ise 1 değerini almaktadır. Birleştirilmiş DenklemHarcama =  1 +  ML +  2 N + u ML = 0 Devlet LisesiHarcama =  1 +  2 N + u ML= 1 Meslek LisesiHarcama =  1 +  +  2 N + u

9 9 Her zaman kukla değişkenler sadece iki değer alırlar; 0 yada 1. Eğer ML 0 değerini alır ise harcama fonksiyonu devlet lisesine giden öğrencilerin harcama fonksiyonu olmakta, yada eğer ML 1 değerini alırsa harcama fonksiyonu meslek lisesine giden öğrencilerin harcama fonksiyonu olmaktadır.  11 1+1+ Birleştirilmiş DenklemHarcama =  1 +  ML +  2 N + u ML = 0 Devlet LisesiHarcama =  1 +  2 N + u ML= 1 Meslek LisesiHarcama =  1 +  +  2 N + u

10 10 Bu aşamada bir şehirdeki 74 lise için gerçek veri setini kullanarak regresyon denklemi oluşturulabilir.

11 11 OkulOkul Tipi Okul HarcamasıN ML 1Meslek345,0006231 2 Meslek 537,0006531 3 Devlet 170,0004000 4 Meslek 526.0006631 5 Devlet 100,0005630 6 Devlet 28,0002360 7Devlet 160,0003070 8 Meslek 45,0001731 9 Meslek 120,0001461 10 Meslek 61,000991 Tablo ilk 10 okulun verilerini göstermektedir. Yıllık harcama yuan olarak ölçülmüştür. Bir yuan yaklaşık olarak 20 U.S centine eşittir. N okullardaki öğrenci sayısıdır. BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER ML okul tipini gösteren kukla değişkendir.

12 12. reg Harcama N ML Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61 ------------------------------------------------------------------------------ Her ne kadar ML kukla değişken olsa da yeni bir açıklayıcı değişkenmiş gibi düşünülerek; Harcama değişkeni, N ve ML değişkenleri üzerine regresyona tabi tutulmaktadır. Katsayı yorumları: Regresyon sonuçları eşitlik şeklinde yeniden yazılabilir. ML değişkenine 0 ve 1 değerleri verilerek yeni eşitlikler türetilebilir. BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

13 13 Devlet Lisesi (ML = 0) Harcama = -34,000 + 133,000ML + 331N Harcama = -34,000 + 331N ^ ^ Eğer ML=0 olursa, devlet lisesine ait eşitlik elde edilir. Buradan yıllık marjinal harcamanın öğrenci başına 331 yuan olduğu ve sabit harcamanın da -34,000 Yuan olduğu ifade edilebilir. Kukla değişkenin katsayısı  ile tahminlenmektedir. Meslek lisesindeki öğrenciler için extra yıllık sabit harcamayı ifade etmektedir. BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

14 14 Devlet Lisesi (ML= 0) Meslek Lisesi (ML = 1) Eğer ML yerine 1 değeri konulursa, meslek lisesi öğrencileri için yıllık sabit harcamayı 99,000 yuan olarak hesaplayabiliriz. Meslek lisesindeki öğrencinin marjinal harcaması ise devlet okulundaki öğrenci ile aynıdır. Harcama = -34,000 + 133,000ML + 331N Harcama = -34,000 + 331N Harcama = -34,000 + 133,000 + 331N = 99,000 + 331N ^ ^ ^ BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

15 15 Dağılma diyagramı regresyon sonuçlarından elde edilen iki harcama fonksiyonunu göstermektedir. BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

16 16. reg Harcama N ML Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61 ------------------------------------------------------------------------------ Kukla değişkeninin katsayısını test etmek için; H 0 :  = 0 ve H 1 :  ≠ 0 hipotezleri t testi yardımı ile test edilebilir. Bir başka ifadeyle, H 0 hipotezi iki okul türü arasında sabit harcamalar bakımından fark olmadığını ifade etmektedir. ML’nin katsayısının prob değeri 0.05 önem düzeyinden küçük olduğu için H 0 hipotezi reddedilebilmektedir. Yani iki okul türünün sabit harcamaları arasında fark vardır. BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

17 17 reg Harcama N ML Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML| 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61 ------------------------------------------------------------------------------ Benzer şekilde diğer katsayılar içinde t-testi yapabiliriz. İlk olarak N ele alınırsa; N ‘in katsayısının da istatistiksel olarak anlamlı olduğu söylenebilir. Bu da bize marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir. BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

18 18. reg Harcama N ML Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61 ------------------------------------------------------------------------------  1 = 0 yani sabit terim için t istatistiğine baktığımızda bu katsayının anlamsız olduğu görülmektedir. BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

19 19 BİRDEN FAZLA KUKLA DEĞİŞKENLİ MODELLER Harcama:Okul harcaması Sadece bir D i kukla değişkenli modellerin yanında, D sayısı iki, üç, hatta yirmiye kadar olan modeller de söz konusu olmaktadır. Daha önce devlet lisesi ve meslek liseleri arasındaki harcama fonksiyonu arasındaki farkı belirtmek için kukla değişken kullanmıştık. Şangay’da iki tip devlet okulu bulunmaktadır. Bunlardan bir tanesi olağan akademik eğitimin verildiği genel liseler, diğeri ise akademik eğitim ile birlikte ticaret eğitimi veren ticaret liseleridir. Harcama =  1  +  T TEK +  N NİT +   İ TİC +  2 N + u

20 20 Harcama =  1  +  T TEK +  N NİT +   İ TİC +  2 N + u Ticaret okullarının öğretim programı genel liselerden çok az bir farklılık göstermekte, sadece genel liselere göre birkaç ticaret eğitimleri bulunmaktadır. Aynı şekilde iki tip meslek lisesi bulunmaktadır. Teknik eğitim okulları(TEK) ve Nitelikli (NİT) öğrenci yetiştiren liselerdir. Sonuçta kalitatif değişkenimiz dört gruba sahiptir. Uygulamada; bir kategori temel sınıf olarak seçilmektedir ve buna bağlı olarak diğer kukla değişkenler tanımlanmaktadır. Genellikle, kategoriler içerisinde en basit ve normal olan kategori temel sınıf olarak seçilmektedir.

21 21 Harcama =  1  +  T TEK +  N NİT +   İ TİC +  2 N + u Şangay örneğinde genel liseleri temel sınıf olarak seçmek en uygundur. Çünkü genel liseler sayıca çok olan liselerdir ve diğer liseler genel liselerin birer varyasyonlarıdır. Dolayısıyla okul tiplerine bağlı olarak üç tane kukla değişken tanımlayabiliriz. TEK : teknik eğitim okulları için kukla değişken; eğer öğrenci teknik okula gidiyorsa 1, diğer durumda 0 değerini alan kukla değişken. Benzer şekilde NİT ve TİC kukla değişkenleri sırasıyla nitelikli öğrenci yetiştiren ve ticaret eğitimi veren okullar için birer kukla değişkenlerdir. Her bir kukla değişkenin katsayı değeri bulunmaktadır ve bu katsayılar temel kategoriye göre her bir okul için ayrı ayrı ekstra harcama maliyetlerini ifade etmektedir. Dikkat edilirse temel kategori (referans kategori) modelde yer almamaktadır ve çıkarılmış kategori olarak ifade edilir.

22 22 Eğer gözlem genel lise ile ilgili ise; diğer kukla değişkenler sıfır değerini almakta ve regresyon modeli en basit duruma indirgenmektedir. Harcama =  1  +  T TEK +  N NİT +   İ TİC +  2 N + u Genel LiseHarcama =  1  +  2 N + u (TEK = NİT = TİC = 0)

23 23 Eğer gözlem teknik lise ile ilgili ise; TEK değişkeni 1 değerini, diğer kukla değişkenlerde 0 değerini almaktadır. Regresyon denklemi ise yukarıda gösterildiği gibi olmaktadır. Harcama =  1  +  T TEK +  N NİT +   İ TİC +  2 N + u Genel LiseHarcama =  1  +  2 N + u (TEK = NİT = TİC = 0) Teknik LiseHarcama = (  1  +  T ) +  2 N + u (TEK = 1; NİT= TİC = 0)

24 24 Harcama =  1  +  T TEK +  N NİT +   İ TİC +  2 N + u Genel LiseHarcama =  1  +  2 N + u (TEK = NİT = TİC = 0) Teknik LiseHarcama = (  1  +  T ) +  2 N + u (TEK = 1; NİT = TİC = 0) Nitelikli Öğr. Yet. LİsesiHarcama = (  1  +  N ) +  2 N + u (NİT= 1; TEK = TİC = 0) Ticaret LisesiHarcama = (  1  +  Tİ ) +  2 N + u (TİC = 1; TEK = NİT = 0) Benzer şekilde gözlem nitelikli öğrenci yetiştiren lisesi yada Ticaret lisesi ise, regresyon denklemleri yukarıda gösterildiği gibi oluşturulmaktadır.

25 25 Yukarıdaki diyagram modeli grafiksel olarak göstermektedir.  katsayısı; teknik, nitelikli ve ticaret lisesi için genel liseye göre ekstra gider harcamalarını ifade etmektedir. Harcama N 1+T1+T 1+1+ 1+İ1+İ 11 Nitelikli Ticaret NN İİ TT Teknik Genel

26 26 Dikkat edilecek olurda  katsayıların büyüklülüğü ve işaretleri için önceden bir varsayımda bulunulmamaktadır. Örnek verilerinden tahminlenecektir. Harcama N 1+T1+T 1+N1+N  1 +  Tİ 11 Nitelikli Ticaret NN  Tİ TT Teknik Genel

27 27 Okul TipHarcama N TEK NİTTİC 1Teknik345,000623100 2Teknik 537,000653100 3Genel 170,000400000 4Nitelikli 526.000663010 5Genel 100,000563000 6Ticaret28,000236001 7Ticaret 160,000307001 8Teknik 45,000173100 9Teknik 120,000146100 10 Nitelikli61,00099010 Yukarıdaki tabloda 74 liseden 10 tanesine ait veriler gösterilmektedir. Her bir kukla değişken TEK, NİT ve TİC kukla değişkenleri okul tiplerine göre oluşturulmuştur.

28 28 Dağılma diyagramı yeni okulların verilerini göstermektedir.

29 29. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Verilere ait regresyon sonuçları tabloda gösterilmiştir. N in katsayısı her bir öğrenci için marjinal harcamayı ifade etmektedir ve yaklaşık 343 yuandır.

30 30. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama| Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ TEK, NİT ve TİC değişkenlerinin katsayıları 154,000, 143,000, ve 53,000 sırasıyla genel liselere göre ilave yıllık sabit harcamaları ifade etmektedir.

31 31. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Sabit terim genel liselerde sabit harcamaların -55000 yuan olduğunu söylemektedir.

32 32 Harcama = -55,000 + 154,000TEK + 143,000NİT+ 53,000TİC + 343N En üsteki regresyon sonuçlarını göstermektedir. Her bir okul için harcama fonksiyonları ayrı ayrı gösterilecektir. ^

33 33 Harcama= -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N Genel LiseHarcama= -55,000 + 343N (TEK= NİT = TİC = 0) Öğrenci başına yıllık marjinal harcama 343 yuandır. Öğrenci başına yıllık sabit harcamalar her bir okul için -55,000 yuan olarak tahmin edilmiştir. ^ ^

34 34 Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N Genel LiseHarcama= -55,000 + 343N (TEK= NİT = TİC = 0) Teknik LiseHarcama= -55,000 + 154,000 + 343N (TEK = 1; NİT = TİC = 0) = 99,000 + 343N Genel liseye göre teknik lisenin ekstra yıllık sabit harcaması 154,000 yuan olarak tahminlenmiştir. ^ ^ ^

35 35 Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N Genel LiseHarcama= -55,000 + 343N (TEK= NİT = TİC = 0) Teknik LiseHarcama= -55,000 + 154,000 + 343N (TEK = 1; NİT = TİC = 0) = 99,000 + 343N Nitelikli LisesiHarcama= -55,000 + 143,000 + 343N (NİT = 1; TEK = TİC = 0) = 88,000 + 343N Ticaret LisesiHarcama= -55,000 + 53,000 + 343N (TİC = 1; TEK = NİT = 0) = -2,000 + 343N Benzer şekilde nitelikli öğrenci yetiştiren ve ticaret okulunun genel liseye göre yıllık ekstra harcaması 143,000 and 53,000 yuandır. ^ ^ ^ ^ ^

36 36 Dikkat edilirse öğrenci başına yıllık marjinal harcama 343 yuan olarak tahmin edilmiştir. ^ ^ ^ ^ ^ Harcama = -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N Genel LiseHarcama= -55,000 + 343N (TEK = NİT = TİC = 0) Teknik LiseHarcama= -55,000 + 154,000 + 343N (TEK = 1; NİT = TİC = 0) = 99,000 + 343N Nitelikli LisesiHarcama= -55,000 + 143,000 + 343N (NİT = 1; TEK = TİC = 0) = 88,000 + 343N Ticaret LisesiHarcama= -55,000 + 53,000 + 343N (TİC = 1; TEK = NİT = 0) = -2,000 + 343N

37 37 Dört harcama grafiği şekilde gösterilmiştir.  Teknik Lise  Ticaret Lisesi  Genel Lise  Nitelikli

38 38. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Bütün katsayılar için t-testi yapabiliriz. N değişkenin katsayısı için t istatistiği 8.52 ve bu da bize beklenildiği gibi marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir.

39 39. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK| 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Ayrıca teknik lise t-istatistiği katsayısı da istatistiksel olarak anlamlıdır. Bunun anlamı ise teknik lise yıllık sabit harcamalarının genel liselerin sabit harcamalarından oldukça büyük olduğunu göstermektedir.

40 40. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Benzer şekilde vasıflı NİT lerin t istatistiği 5.15 olarak bulunmuştur.

41 41. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Bununla birlikte Ticaret lisesinin t istatistiği sadece 1.71 dir ve bu da ticaret lisesi sabit harcamalarının genel lise sabit harcamalarında yeterince farklı olmadığını göstermektedir. Bu sonuç çok şaşırtıcı değil, çünkü ticaret lisesi genel liselerden çok farklı bir eğitime sahip değil.

42 42. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Son olarak kukla değişkenlerin ortak açıklayıcısı gücünü test etmek için F testi yapabiliriz. H 0 :  T =  N =  Tİ = 0 olarak tanımlanabilir. Alternatif hipotez ise en az bir  sıfırdan farklıdır şeklinde kurulmaktadır.

43 43. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama| Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748 ------------------------------------------------------------------------------ Kukla değişkenli modelinde hata kareler toplamı 5.41×10 11.

44 44. reg Harcama N Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05 ------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- N | 339.0432 49.55144 6.842 0.000 240.2642 437.8222 _cons | 23953.3 27167.96 0.882 0.381 -30205.04 78111.65 ------------------------------------------------------------------------------ Kukla değişkensiz modelin hata kareler toplamı 8.92×10 11.

45 45. reg Harcama N Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Değişkenlerin katsayılarına 0 sınırlaması konan genel F testi uygulanabilir.

46 46. reg Harcama N Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 F istatistiğinin payında hesaplanan RSS modeldeki kukla değişken sayısına bölünmektedir. Bir başka ifadeyle, modele eklenen yeni değişken sayısına bölünmektedir. f 1 = c =3 f 2 =n-k=74-5=69

47 47. reg Harcama N Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578 H 0 hipotezi redddilebilir

48 48 KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU 1.HAL: Sabit Terimlerin Farklı Eğimlerin Eşit olması ≠ =

49 49 KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU 2.HAL: Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali ≠ =

50 50 ) ) b 2 + b 3 b3b3 b1b1 YiYi XiXi

51 51 KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU 3.HAL: Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması ≠ ≠

52 52 YiYi XiXi ) b4b4 ) b 3 +b 4 b1b1 b 1 +b 2

53 53 İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ 2. Chow Testi 1.t testi ne bakılır.  b 3 katsayısı anlamsız ve b 2 anlamlı ise 1.durum (sabit terim farklı eğimler aynı)  -b 2 katsayısı anlamsız b 3 anlamlı ise 2. durum (sabit terim aynı eğimler farklı)  her iki katsayı da anlamlı ise 3. durum (iki fonk. birbirinden farklıdır denir) Eğim farkı Sabit terim farkı

54 54 İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ Uygulama: Yıllık Sigara Tüketimi Cinsiyet (D i ) (Erkek = 1, Kadın = 0) Yıllık Gelir (X i ) 251400 200260 190270 241360 200240 221310 211280 180200 190260 221320

55 55 İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ Dependent Variable: Y Method: Least Squares Included observations: 10 VariableCoefficientStd. Errort-StatisticProb. C14.942312.5983835.7506190.0012 D i -3.7863443.350850-1.1299650.3016 X i 0.0173080.0105081.6470200.1507 D i X0.0175550.0122451.4336240.2017 R-squared0.955060 Mean dependent var21.00000 Adjusted R-squared0.932591 S.D. dependent var2.260777 S.E. of regression0.586972 Akaike info criterion2.061496 Sum squared resid2.067219 Schwarz criterion2.182530 Log likelihood-6.307482 F-statistic42.50422 Durbin-Watson stat1.943502 Prob(F-statistic)0.000195 Sabit Terim FarkıEğim Farkı

56 56 Sonuç olarak İki sınıf tüketim fonksiyonlarının aynı olduğunu söyleyebiliriz.

57 57 BİR MODELDE KUKLA DEĞİŞKENLERİN KARŞILIKLI OLARAK BİRBİRİNİ ETKİLEMELERİ PROBLEMİ Erkeğin Tüketim Farkı Şehirde Oturanların Tüketim Farkı Şehirde Oturan bir Erkeğin Tüketim Farkı

58 58 b 4 katsayısının t istatistiğine bakılır. Şayet anlamlıysa iki kukla değişkenin modelde birlikte yer alması, bunların bireysel etkilerini azaltabilir veya arttırabilir. Bu durumda bu katsayının modelde yer almaması da spesifikasyon hatalarına yol açabilir.

59 59 MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Üçer Aylar Karlar (Milyon Dolar) Şatışlar (Milyon Dolar) 1965-I10503114862 II12092123968 III10834121454 IV12201131917 1966-I12245129911 II14001140976 III12213137828 IV12820145465 D2D2 0 1 0 0 0 1 0 0 D3D3 0 0 1 0 0 0 1 0 D4D4 0 0 0 1 0 0 0 1

60 60 MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Dependent Variable: Kar Variable Coefficient Std. Error t-Statistic Prob. C 6688.363 1711.3663.9082010.0009 D 2 1322.892 638.4745 2.0719570.0521 D 3 -217.8054 632.2552 -0.3444900.7343 D 4 183.8564 654.2925 0.2810000.7817 Satış 0.038246 0.011481 3.3312810.0035 R 2 =0.525494 İstatistiki olarak anlamsız

61 61 MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Dependent Variable: Kar Sample: 1965:1 1970:4 VariableCoefficientStd. Error t-Statistic Prob. C 6515.5811623.083 4.0143230.0006 D 2 1331.352493.0214 2.7003950.0134 Satış 0.0393100.010575 3.7173150.0013 R 2 = 0.515460 Mevsim dalgalanmalarının etkisinde

62 EŞİK DEĞER ETKİLERİ * *62-81 arası slaytlar, Mustafa SEVÜKTEKİN, Ekonometriye Giriş, 563-576

63 Kukla değişkenler arasında nitelik, kategorik, vasıf, özellik, ortaya çıkış ya da gerçekleşme farklılıkları söz konusudur. Gerçek hayatta herhangi bir kukla değişkenin vasıfları veya özellikleri arasındaki geçiş noktaları olarak tanımlanan eşik değerler her zaman kesin sınırlarla belirlenemeyebilir. Bu konuda uygulanabilecek bir yaklaşım, bağımlı değişkenin açıklayıcı değişkenlere göre dağılım diyagramından açıklayıcı değişkenin belli bir spesifik değerinden sonra kesin bir değişimin görülüp görülmediğini incelemektir. Ya da geleneksel uygulamalar yardımıyla benzer gözlemler ile eşik değerler saptanmaya çalışılır. Düzeyler arasındaki farklılıklar eşik değerlerle tanımlanabilir ve kukla değişkenler ile gösterilebilir.

64 Parçalı Kesikli (Spline) Fonksiyonlar Genelde farklı parçaların birleştirilmesiyle oluşan kesikli yapıdaki fonksiyonlara parçalı kesikli (spline) fonksiyon denir. Parçalar farklı eğimli doğru parçaları olabilecekleri gibi, doğrusal olmayan fonksiyonlar da olabilir Fonksiyon, parçalarının birleşme noktasında kırılma gösterir. Bu kırılma noktaları eşik değerler olarak nitelendirilir. Bireylerin değişen yaşlarının ve eğitim düzeylerinin gelire olan etkileri incelenmiş ve özellikle eğitim düzeyi ile ilgili eşik değerlerden yararlanılmıştır. Eğitim düzeyi ile yaşlar arasında başka bir eşik değer tanımı yapılabilir. Eğitim düzeyi ile ilişkilendirilen yaş eşik değerleri; 20 yaş için lisans öncesi eğitimin, 25 yaş için lisans eğitiminin tamamlandığı şeklinde oluşturulur. Bu tanım yardımı ile kabaca bireyler için gelirin zaman profili çıkarılabilir.

65 65 GelirYaşEğitimLÖLYLDO 7001601000 9001701000 8501801000 13501901000 13001901000 12002010100 11002001000 14502010100 17002101000 17502101000 24002210100 24002310100 26502301000 20002401000 17502401000 29002401000 35002520010 32002510100 28502810100 23002810100 37002920010 28503101000 40003330001 42003430001 34503401000 40003620010 32003810100 50004230010 37504410100 43004520010

66 Buna göre önce belirlenen yaş eşikleri için tahminler üç yaş grubuna ayrılarak tahmin edilmiştir; Yaş ≤ 20içinGelir1 = -1614 + 146 Yaş1 20 < Yaş ≤ 25 içinGelir2 = -4559 + 301 Yaş2 Yaş > 25için Gelir3 = 719 + 82.9 Yaş3 biçiminde elde edilir. (1) Gelir1 = 20 yaşından küçük gelir ve yaş değişkenlerine ait gözlemler kullanılarak elde edilmiştir. Gelir2 = 20 – 25 yaş arasındaki gelir ve yaş değişkenlerine ait gözlemler kullanılarak elde edilmiştir. Gelir3 = 25 yaşından büyük gelir ve yaş değişkenlerine ait gözlemler kullanılarak elde edilmiştir.

67 Şekil 1

68 Yukarıda tanımlanan eşik değerle 20 ve 25 yaş sınırları aynı zamanda birer dönme noktaları olarak da adlandırılır. Daha sonra bu dönme noktaları kukla değişken gibi tanımlanacak olursa: D 1 = 1,eğeryaş > y 1 * ise (2) D 2 = 1,eğeryaş > y 2 * ise y 1 * ve y 2 * eşik değerlerdir; y 1 * = 20 ve y 2 * = 25 dir.

69 69 D1D1 D2D2 Yas 1 Yas 2 0000 0000 0000 0000 0000 0000 0000 0000 1010 1010 1020 1030 1030 1040 1040 1040 1050 1050 1183 1183 1194 11116 11138 11149 11 9 111611 111813 112217 112419 112520

70 Denklem (2) eşik değerleri açısından ifade edilecek olursa; D 1 = 1,eğeryaş > 20ise (3) D 2 = 1,eğeryaş > 25ise şeklinde yazılır. Denklem (1)’e kukla değişkenler dahil ederek aşağıdaki (4) nolu denklem tahmin edilmiştir: Gelir = β 0 + β 1 Yaş + α 1 D 1 + γ 1 D 1 Yaş + α 2 D 2 + γ 2 D 2 Yaş + u (4) Gelir = -1614 + 146 Yaş – 2945 D 1 + 155 D 1 Yaş + 5278 D 2 – 218 D 2 Yaş (5)

71 Şekil 2

72 Birinci eşik değer öncesi grup için yani, lisans eğitimi olmayan bireyler için gelir ve yaş ilişkisi; (Yaş ≤ 20) = -1614 + 146 Yaş(6) Lisans eğitimi alan bireyler için gelir ve yaş ilişkisi; (20 < Yaş ≤ 25) = -4559 + 301 Yaş(7) ve lisansüstü (yüksek lisans + doktora) eğitimi alan bireyler için gelir ve yaş ilişkisi; (Yaş > 25) = 719 + 83 Yaş(8) Dikkat edilecek olursa denklem (1)’de elde edilen sonuçlar ve denklem (5)’de elde edilen sonuçlar aynıdır.

73 Parçalı Sürekli (Piecewise) Fonksiyonlar Ekonomik modellerin birçoğunda herhangi bir açıklayıcı değişken ya da değişkenlerde küçük bir değişme olduğunda bağımlı değişken üzerindeki etkinin ölçülmesi gerekir. Dolayısıyla bir ekonomik modelde özellikle niteliksel veya kukla değişken kullanıldığında regresyon modelinin hem sabit, hem eğim, hem de her ikisinde bir kayma ve değişme hesaplanmak istendiğinde temel model yapısı yeniden gözden geçirilmelidir.

74 Daha ayrıntılı analiz için kesikli parçalardan oluşan bir model sürekli olarak tahmin edilmek istenirse bazı kısıtlamalarla bu sağlanabilir. Örnekte bazı kısıtlamalar ile eğitimdeki değişmelere izin verilebilir. Aşağıda gelir ve yaş ilişkisinin grafiği verilmiştir.

75 Şekil 3

76 Şekilde tire çizgili fonksiyonlar üç parçalı ve eğimleri birbirinden farklı olan ve farklı yaş grubundaki kişilere ilişkin gelir fonksiyonlarıdır. Bu fonksiyonların tahminleri denklem (1) ve şekil 1’de verilmiştir. Bu parçalı fonksiyonların spline fonksiyon tahmini denklem (5) ve regresyon doğrusu şekil 2’de verilmiştir. Gelir = -1614 + 146 Yaş – 2945 D 1 + 155 D 1 Yaş + 5278 D 2 – 218 D 2 Yaş (5) Farklı yaş grupları açısından regresyon doğruları süreksiz (kesikli) bir yapı gösterse de, yaşın gelir üzerindeki etkisine ilişkin gerçek doğru model, yapısal kırılmalı (eşik değerli) sürekli bir modeldir.

77 Eğer yaşın bir fonksiyonu olarak gelir açıklanmak istenirse, eğitim düzeylerine bağlı olarak bazı eşik değerler dikkate alındığında yapısal kırılmalar ortaya çıkacaktır. Bu durumda fonksiyonda kırılmadan kaynaklanan kesiklilik (veya süreksizlik) söz konusu olur. Yani gelir düzeyinde yıldan yıla kaymalar yaşanabilir.

78 Dolayısıyla fonksiyon üç düz doğrudan oluşan bir parçalı (piecewise) doğrusal modeldir. Parçalı doğrusal modeller oldukça büyük modeller setinin veya spline olarak adlandırılan ilişkilerin özel bir halidir. Spline fonksiyonlar ayrı ayrı fonksiyonlardır, fakat her bir parçayı gösteren eğri sürekli bir fonksiyondur ve düz bir doğru şart değildir.

79 Örnekte yaş değişkeni için aşağıdaki gibi tanımlamalar yapılabilir: Yaş 1 = Yaş Yaş 2 = Yaş – 20,Eğer yaş > 20 ise değilse 0 Yaş 3 = Yaş – 25,Eğer yaş > 25 ise değilse 0

80 ve denklem (4) bu tanımlamalar ile yeniden yazılırsa; Gelir = β 0 + β 1 Yaş 1 + γ 1 D 1 Yaş 2 + γ 2 D 2 Yaş 3 + u(6) denklemi elde edilir. Denklem (6) tahmin edilerek; Gelir = -2003 +169 Yaş + 141 D1 Yaş 2 – 236 D 2 Yaş 3 (7) sonucu elde edilir. Buna göre parçalı doğrusal modeli aşağıda şekil 4’de görülmektedir. Kırılma (eşik) noktalarında fonksiyonun farkı şekil 2 ile karşılaştırılabilir.

81 Şekil 4

82 82 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI UYGULAMA: 1935-1954 yıllarına arasında General Motor, Westinghouse ve General Electric firmalarna ait yatırım (Y), firmanın değeri (X 2 ) ve sermaye stoğu (X 3 ) verilerine ait tablo aşağıda verilmiştir.

83 83 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI Firmaların yatırımları arasında fark olup olmadığını inceleyebilmek için de kukla değişkenlerden yararlanabiliriz. Firmaların ilk üç yıllarına ait veriler ile oluşturulan yeni tablo aşağıdaki gibidir. YıllarY X2X2 X3X3 DiDi Firma 1935 317.63078.52.81GM 1936 391.84661.752.61GM 1937 410.65387.1156.91GM 1935 12.93191.51.80WE 1936 25.90516.00.80WE 1937 35.05729.07.40WE 1935 33.11170.697.80GE 1936 45.02015.8104.40GE 1937 77.22803.3118.00GE

84 84 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI GM yatırımlarının diğer firma yatırımlarından sabit terim kadar farklı olduğunu ifade etmektedir.

85 85 Dependent Variable: Y Method: Least Squares Included observations: 60 VariableCoefficientStd. Errort-StatisticProb. C-61.8075423.79039-2.5980040.0120 X20.0383110.0167522.2868840.0260 X30.3473030.03204810.836830.0000 D i 278.591151.743385.3840910.0000 R-squared0.924866 Mean dependent var251.067 Adjusted R-squared0.920841 S.D. dependent var311.6501 S.E. of regression87.68352 Akaike info criterion11.84969 Sum squared resid430550.4 Schwarz criterion11.9893 Log likelihood-351.4906 F-statistic229.7778 Durbin-Watson stat0.502776 Prob(F-statistic)0.000000 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI İstatistiki olarak anlamlı GM yatırımları, diğer firma yatırımlarından farklı ve fazladır.

86 86 ÖRNEKLER

87 87 Y i =  +  D i +u i Y i = Öğretim Üyelerinin Yıllık Maaşları D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Varyans Analiz Modelleri (ANOVA) Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Y i |D i = 0 ) =  Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i |D i = 1) =  +  Örnek: Özel bir üniversitede öğretim üyelerinin yıllık maaşları ile cinsiyetleri arasında önce varyans daha sonra tecrübe değişkeni eklenerek kovaryans modeli oluşturulacaktır:

88 88 Y i =  +  D i (0.32)(0.44) t(57.74)(7.44),R 2 =0.8737 3.280 18.00 21.280

89 89 Y i =   +   D i +  X i + u i Y i = Öğretim Üyelerinin Yıllık Maaşları X i = Öğretim Üyesinin Yıl olarak Tecrübesi D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Kadın Öğretim Üyelerinin Ortalama Maaşları : E( Y i |X i,D i = 0 ) =    X i Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i |X i,D i = 1) = (   +    X i

90 90 MaaşCinsiyetTecrübe 22116 19012 18012 21.7115 18.5010 21111 20.5113 1708 17.509 21.2114

91 91 Yıllık Maaş Tecrübe (yıl olarak) Y X                                                     22 11 Y    X i Y  (   +    X i Kadın Erkek Y i =  +  D i + 0.289 X i s(b)(0.95)(0.44)(0.09) p(0.000)(0.002)(0.020), R 2 =0.949 D i = 1 Öğretim Üyesi Erkekse = 0 Öğretim Üyesi Kadınsa

92 92 DATA7-19 1960-1988 yılları arasında Türkiye’deki Sigara Tüketimi Q Yetişkinlerin sigara tüketim miktarı(kg), Range 1.86 - 2.723. Y GNP(1968) TL,Range 2560 - 5723. PTürkiye’deki sigara fiyatları Range 1.361 - 3.968. ED1Kayıtlı ortaokul ve lise mezunu nüfus oranı(12-17 yaş) Range 0.112 - 0.451. ED2Kayıtlı üniversite mezunu oranı (20-24) Range 0.026 - 0.095. D82= 1, 1982 ve sonrası D86= 1, 1986 ve sonrası

93 93 Dependent Variable: Q Sample: 1960 1988 Included observations: 29 VariableCoefficientStd. Error t-Statistic Prob. P-0.0972910.079389 -1.225493 0.2340 ED2-5.5472952.679248 -2.07046 0.0509 ED1-2.9941662.708828 -1.105336 0.2815 D86-0.2627000.090825 -2.89238 0.0087 D82-0.2887390.083649 -3.451774 0.0024 Y0.0007620.000190 4.009205 0.0006 C5.1139345 0.34132 0.101585 0.9200 Katsayılar istatistiki olarak anlamsız

94 94 Dependent Variable: Q Method: Least Squares Sample: 1960 1988 Included observations: 29 VariableCoefficientStd. Errort-StatisticProb. ED2-6.4552592.724204-2.3695950.0266 D86-0.3518220.078985-4.4542970.0002 D82-0.2694290.084743-3.1793850.0042 Y0.0006720.0001703.9452280.0006 C58.1887833.266181.7491870.0936

95 95 DATA7-2 Belirli bir şirkette çalışan 49 kişinin istihdam durumu ve ücretleri WAGE = Aylık Ücret (Range 981 - 3833) EDUC = 8 yıllık eğitimden sonraki sahip olunan eğitim seviyesi(Range 1 - 11) EXPER =Şirkette çalışma süresi(Range 1 - 23) AGE = Yaş (25 - 64) GENDER = 1, Erkek ise; 0 kadın ise RACE = 1, beyaz ise; 0 diğerleri CLERICAL = 1 büro memuru ise, 0 diğerleri MAINT = 1 bakım işlerinde çalışıyor ise; 0 diğerleri CRAFTS =1,usta ise; 0 diğerleri Temel sınıf Profesyonel meslek grupları.

96 96 Dependent Variable: WAGE Method: Least Squares Included observations: 49 VariableCoefficientStd. Errort-StatisticProb. C1637.202263.67266.2092240.0000 EDUC49.3317827.996781.7620520.0855 EXPER27.295099.4888832.8765330.0064 GENDER473.6966152.48183.1065780.0034 RACE207.0888130.44911.5875060.1201 CLERICAL-946.7380174.6505-5.4207580.0000 MAINT-1053.424203.4297-5.1783200.0000 CRAFTS-708.8822176.0507-4.0265800.0002 R-squared0.737516 Mean dependent var1820.204 Adjusted R-squared0.692702 S.D. dependent var648.2687 S.E. of regression359.3643 Akaike info criterion14.75483 Sum squared resid5294850. Schwarz criterion15.06370 Log likelihood-353.4934 F-statistic16.45717 Durbin-Watson stat2.107977 Prob(F-statistic)0.000000

97 97 DATA 7-9 1985 yılında koleje giriş yapan öğrencilerin ilk yıl başarılarını göstermekte colgpa = 1986 sonbaharındaki ortalamaları (Range 0.85 - 3.97) hsgpa = Lise GPA (Range 2.29 - 4.5) vsat = Sözel derecesi (Range 200 - 700) msat = Sayısal derecesi (Range 330 - 770) dsci = 1 Bilim dalı için, 0 diğerleri dsoc = 1 Sosyal bilim dallı için, 0 diğerleri dhum = 1 Beşeri bilimdalı için 0 diğerleri darts = 1 Sanat dalı için, 0 diğerleri dcam = 1 Öğrenci kampüste yaşıyorsa, 0 diğerleri dpub = 1 Genel lise mezunu ise, 0 diğerleri

98 98 Dependent Variable: COLGPA Method: Least Squares Sample: 1 427 Included observations: 427 VariableCoefficientStd. Errort-StatisticProb. C0.3672960.2243021.6375060.1023 HSGPA0.4059140.0634186.4006300.0000 VSAT0.0007260.0002902.5039070.0127 MSAT0.0010860.0003033.5866090.0004 DSCI-0.0273230.057319-0.4766730.6338 DSOC0.0561480.0727780.7714940.4409 DHUM-0.0040590.141771-0.0286320.9772 DARTS0.2286500.1889211.2102940.2269 DCAM-0.0407050.052162-0.7803620.4356 DPUB0.0294030.0630400.466416 0.6412 Katsayılar istatistiki olarak anlamsız

99 99 Dependent Variable: COLGPA VariableCoefficient Std. Error t-Statistic Prob. C0.4232490.2197491.9260530.0548 HSGPA0.3983490.0605866.5748820.0000 VSAT0.0007370.0002812.6273610.0089 MSAT0.0010150.0002943.4577490.0006


"1 KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller." indir ppt

Benzer bir sunumlar


Google Reklamları