Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

KUKLA DEĞİŞKENLİ MODELLER

Benzer bir sunumlar


... konulu sunumlar: "KUKLA DEĞİŞKENLİ MODELLER"— Sunum transkripti:

1 KUKLA DEĞİŞKENLİ MODELLER
Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller) Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler Parçalı Doğrusal Regresyon

2 Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri)
Yi = a + b Di +ui Yi = Öğretim Üyelerinin Yıllık Maaşları Di = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Varyans Analiz Modelleri (ANOVA) Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Yi|Di = 0 ) = a Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Yi|Di = 1) = a + b

3 Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri)
3.280 21.280 18.00 Yi = Di (0.32) (0.44) t (57.74)(7.44) , R2=0.8737

4 Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri)
Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

5 Birleştirilmiş Denklem Yıllık Okul Harcaması = b1 + b2 ML + u
ML = 0 Devlet Lisesi Yıllık Okul Harcaması = b1 ML= 1 Meslek Lisesi Yıllık Okul Harcaması = b1 + b2

6 Yıllık Okul Harcaması = b1 + b2 ML + u
Meslek Lisesi Devlet Lisesi ML = 0 Devlet Lisesi ML= 1 Meslek Lisesi Yıllık Okul Harcaması = b1 + b2 ML + u

7 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
KUKLA DEĞİŞKENLERİN DİĞER KANTİTATİF DEĞİŞKENLERLE ALINDIĞI MODELLER (KOVARYANS ANALİZİ MODELLER) BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER Harcama:Okul harcaması N:Öğrenci sayısı Bu kukla değişkenlerin açıklayıcı değişken olarak regresyon denkleminde nasıl yer aldıkları incelenecektir.

8 Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

9 Meslek lisesindeki öğrenciler belirli meslek dallarında yetenek sahibi olmaya çalışırken her meslek grubuna özgü gerekli olan araç ve gereçlerin temini için devlet lisesinde okuyan öğrencilere göre yıl içerisinde daha fazla harcama yapmaları gerekmektedir.

10 Her iki lisede okuyan öğrencilerin harcamaları arasındaki farkı görmek için birinci yol iki grup içinde ayrı ayrı regresyon denklemi oluşturmaktır.

11 Bununla birlikte iki ayrı regresyon denklemi kurmanın bazı sakıncaları olmaktadır. Bu sakıncalardan bir tanesi; büyük bir anakütle ile çalışmak yerine ayrı ayrı küçük örneklemler ile çalışmak katsayı tahminlerinin doğruluğu üzerinde ters etki olmasına neden olacaktır.

12 b1' b1 OCC = 0 Devlet Lisesi Harcama = b1 + b2N + u OCC = 1 Meslek Lisesi Harcama= b1' + b2N + u İki lise harcamaları arasındaki fark için diğer bir yol ise ; meslek lisesi harcama denkleminin sabit terimi b1' in devlet lisesinden daha büyük olduğunu varsayan bir hipotez kurmaktır.

13 b1' b1 Devlet Lisesi: 0 Harcama= b1 + b2N + u Meslek Lisesi :1 Harcama= b1' + b2N + u Aslında, bu varsayım ile her iki lise için yıllık marjinal maliyetlerin aynı fakat sabit maliyetlerin farklı olduğu varsayımı yapılmaktadır. Marjinal maliyet varsayımı görünüşte makul gözükmese de, bu varsayım anlatımı kolaylaştırmak için yapılmaktadır.

14 d İki sabit terim arasındaki fark olarak tanımlanabilir: d = b1' - b1.
Devlet Lisesi Harcama = b1 + b2N + u Meslek Lisesi Harcama = b1' + b2N + u d İki sabit terim arasındaki fark olarak tanımlanabilir: d = b1' - b1.

15 OCC = 0 Devlet Lisesi Harcama = b1 + b2N + u
b1+d d b1 d = b1' - b1 idi. b1' = b1 + d olacaktır ve meslek lisesine ait harcama fonksiyonu aşağıdaki gibi yazılabilir: OCC = 0 Devlet Lisesi Harcama = b1 + b2N + u OCC = 1 Meslek Lisesi Harcama = b1 + d + b2N + u

16 Birleştirilmiş Denklem Harcama = b1 + d ML + b2N + u
Artık iki harcama fonksiyonunu birleştirip kukla değişken ML oluşturulabilir. ML öğrenci devlet lisesine gidiyor ise 0 değerini, meslek lisesine gidiyor ise 1 değerini almaktadır. Birleştirilmiş Denklem Harcama = b1 + d ML + b2N + u ML = 0 Devlet Lisesi Harcama = b1 + b2N + u ML= 1 Meslek Lisesi Harcama = b1 + d + b2N + u

17 b1+d d b1 Her zaman kukla değişkenler sadece iki değer alırlar; 0 yada 1. Eğer ML 0 değerini alır ise harcama fonksiyonu devlet lisesine giden öğrencilerin harcama fonksiyonu olmakta, yada eğer ML 1 değerini alırsa harcama fonksiyonu meslek lisesine giden öğrencilerin harcama fonksiyonu olmaktadır. Birleştirilmiş Denklem Harcama = b1 + d ML + b2N + u ML = 0 Devlet Lisesi Harcama = b1 + b2N + u ML= 1 Meslek Lisesi Harcama = b1 + d + b2N + u

18 100000 200000 300000 400000 500000 600000 700000 500 1000 1500 N Harcama Meslek Lisesi Devlet Bu aşamada bir şehirdeki 74 lise için gerçek veri setini kullanarak regresyon denklemi oluşturulabilir.

19 E ( Yi|Xi,Di = 1) = (a1 + a2 )+bXi
KOVARYANS ANALİZİ MODELLER BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER Yi = a1 + a2 Di + b Xi + ui Yi = Öğretim Üyelerinin Yıllık Maaşları Xi = Öğretim Üyesinin Yıl olarak Tecrübesi Di = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Kadın Öğretim Üyelerinin Ortalama Maaşları : E( Yi|Xi,Di = 0 ) = a1+bXi Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Yi|Xi,Di = 1) = (a1 + a2 )+bXi

20 KOVARYANS ANALİZİ MODELLER BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Maaş Cinsiyet Tecrübe 22 1 16 19 12 18 21.7 15 18.5 10 21 11 20.5 13 17 8 17.5 9 21.2 14

21 Y Y= (a1 + a2 )+bXi Yıllık Maaş Y=a1+bXi Erkek Kadın a2 a1 X
Tecrübe (yıl olarak) Y X Y= (a1 + a2 )+bXi Y=a1+bXi Erkek Kadın a2 Di = 1 Öğretim Üyesi Erkekse = 0 Öğretim Üyesi Kadınsa a1 Yi = Di Xi s(b) (0.95) (0.44) (0.09) p (0.000) (0.002) (0.020) , R2=0.949

22 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Okul Okul Tipi Okul Harcaması N ML 1 Meslek 345, 2 Meslek 537, 3 Devlet 170, 4 Meslek 5 Devlet 100, 6 Devlet 28, 7 Devlet 160, 8 Meslek 45, 9 Meslek 120, 10 Meslek 61, Tablo ilk 10 okulun verilerini göstermektedir. Yıllık harcama yuan olarak ölçülmüştür. Bir yuan yaklaşık olarak 20 U.S centine eşittir. N okullardaki öğrenci sayısıdır.

23 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Okul Okul Tipi Okul Harcaması N ML 1 Meslek 345, 2 Meslek 537, 3 Devlet 170, 4 Meslek 5 Devlet 100, 6 Devlet 28, 7 Devlet 160, 8 Meslek 45, 9 Meslek 120, 10 Meslek 61, ML okul tipini gösteren kukla değişkendir.

24 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
. reg Harcama N ML Source | SS df MS Number of obs = F( 2, 71) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | ML | _cons | Her ne kadar ML kukla değişken olsa da yeni bir açıklayıcı değişkenmiş gibi düşünülerek; Harcama değişkeni , N ve ML değişkenleri üzerine regresyona tabi tutulmaktadır.

25 Katsayı yorumları: . . reg Harcama N ML
Source | SS df MS Number of obs = F( 2, 71) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama| Coef. Std. Err t P>|t| [95% Conf. Interval] N | ML | _cons | Katsayı yorumları: .

26 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
^ Harcama = -34, ,000ML + 331N Regresyon sonuçları eşitlik şeklinde yeniden yazılabilir. ML değişkenine 0 ve 1 değerleri verilerek yeni eşitlikler türetilebilir.

27 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Devlet Lisesi (ML = 0) ^ Harcama = -34, ,000ML + 331N ^ Harcama = -34, N Eğer ML=0 olursa, devlet lisesine ait eşitlik elde edilir. Buradan yıllık marjinal harcamanın öğrenci başına 331 yuan olduğu ve sabit harcamanın da -34,000 Yuan olduğu ifade edilebilir.

28 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Devlet Lisesi (ML = 0) ^ Harcama = -34, ,000ML + 331N ^ Harcama = -34, N Kukla değişkenin katsayısı d ile tahminlenmektedir. Meslek lisesindeki öğrenciler için extra yıllık sabit harcamayı ifade etmektedir.

29 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Devlet Lisesi (ML= 0) Meslek Lisesi (ML = 1) ^ Harcama = -34, ,000ML + 331N ^ Harcama = -34, N ^ Harcama = -34, , N = 99, N Eğer ML yerine 1 değeri konulursa, meslek lisesi öğrencileri için yıllık sabit harcamayı 99,000 yuan olarak hesaplayabiliriz. Meslek lisesindeki öğrencinin marjinal harcaması ise devlet okulundaki öğrenci ile aynıdır.

30 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Dağılma diyagramı regresyon sonuçlarından elde edilen iki harcama fonksiyonunu göstermektedir.

31 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
. reg Harcama N ML Source | SS df MS Number of obs = F( 2, 71) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | ML | _cons | Katsayıları hesaplamak için ayrıca regresyon sonuçlarında standart hata ve tanımlayıcı istatistikler verilebilir.

32 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
. reg Harcama N ML Source | SS df MS Number of obs = F( 2, 71) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | ML | _cons | Kukla değişkeninin katsayısını test etmek için; H0: d = 0 ve H1: d ≠ 0 hipotezleri t testi yardımı ile test edilebilir.

33 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
.reg Harcama N ML Source | SS df MS Number of obs = F( 2, 71) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | ML | _cons | Bir başka ifadeyle, H0 hipotezi iki okul türü arasında sabit harcamalar bakımından fark olmadığını ifade etmektedir. ML’nin katsayısının prob değeri 0.05 önem düzeyinden küçük olduğu için H0 hipotezi reddedilebilmektedir. Yani iki okul türünün sabit harcamaları arasında fark vardır.

34 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
reg Harcama N ML Source | SS df MS Number of obs = F( 2, 71) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | ML| _cons | Benzer şekilde diğer katsayılar içinde t-testi yapabiliriz. İlk olarak N ele alınırsa; N’in katsayısının da istatistiksel olarak anlamlı olduğu söylenebilir. Bu da bize marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir.

35 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
. reg Harcama N ML Source | SS df MS Number of obs = F( 2, 71) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | ML | _cons | b1 = 0 yani sabit terim için t istatistiğine baktığımızda bu katsayının anlamsız olduğu görülmektedir.

36 Harcama:Okul harcaması
BİRDEN FAZLA KUKLA DEĞİŞKENLİ MODELLER Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u Harcama:Okul harcaması Bir önceki modellerde olduğu gibi sadece bir Di kukla değişkenli modelleri yanında, D sayısı iki, üç, hatta yirmiye kadar olan modellerde söz konusu olmaktadır.

37 BİRDEN FAZLA KUKLA DEĞİŞKENLİ MODELLER
Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u Bir önceki bölümlerde devlet lisesi ve meslek liseleri arasındaki harcama fonksiyonu arasındaki farkı belirtmek için kukla değişken kullanmıştık.

38 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Şangay’da iki tip devlet okulu bulunmaktadır. Bunlardan bir tanesi olağan akademik eğitimin verildiği genel liseler, diğeri ise akademik eğitim ile birlikte ticaret eğitimi veren ticaret liseleridir.

39 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Ticaret okullarının öğretim programı genel liselerden çok az bir farklılık göstermekte, sadece genel liselere göre birkaç ticaret eğitimleri bulunmaktadır.

40 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Aynı şekilde iki tip meslek lisesi bulunmaktadır. Teknik eğitim okulları(TEK) ve Nitelikli (NİT) öğrenci yetiştiren liselerdir.

41 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Sonuçta kalitatif değişkenimiz dört gruba sahiptir. Uygulamada; bir kategori temel sınıf olarak seçilmektedir ve buna bağlı olarak diğer kukla değişkenler tanımlanmaktadır.

42 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Genellikle, kategoriler içerisinde en basit ve normal olan kategori temel sınıf olarak seçilmektedir.

43 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Şangay örneğinde genel liseleri temel sınıf olarak seçmek en uygundur. Çünkü genel liseler sayıca çok olan liselerdir ve diğer liseler genel liselerin birer varyasyonlarıdır.

44 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Dolayısıyla okul tiplerine bağlı olarak üç tane kukla değişken tanımlayabiliriz. TEK : teknik eğitim okulları için kukla değişken; eğer öğrenci teknik okula gidiyorsa 1, diğer durumda 0 değerini alan kukla değişken.

45 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Benzer şekilde NİT ve TİC kukla değişkenleri sırasıyla nitelikli öğrenci yetiştiren ve ticaret eğitimi veren okullar için birer kukla değişkenlerdir.

46 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Her bir kukla değişkenin katsayı değeri bulunmaktadır ve bu katsayılar temel kategoriye göre her bir okul için ayrı ayrı ekstra harcama maliyetlerini ifade etmektedir.

47 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Dikkat edilirse temel kategori (referans kategori) modelde yer almamaktadır ve çıkarılmış kategori olarak ifade edilir.

48 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Genel Lise Harcama = b1 + b2N + u (TEK = NİT = TİC = 0) Eğer gözlem genel lise ile ilgili ise; diğer kukla değişkenler sıfır değerini almakta ve regresyon modeli en basit duruma indirgenmektedir.

49 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Genel Lise Harcama = b1 + b2N + u (TEK = NİT = TİC = 0) Teknik Lise Harcama = (b1 + dT) + b2N + u (TEK = 1; NİT= TİC = 0) Eğer gözlem teknik lise ile ilgili ise; TEK değişkeni 1 değerini, diğer kukla değişkenlerde 0 değerini almaktadır. Regresyon denklemi ise yukarıda gösterildiği gibi olmaktadır.

50 Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Genel Lise Harcama = b1 + b2N + u (TEK = NİT = TİC = 0) Teknik Lise Harcama = (b1 + dT) + b2N + u (TEK = 1; NİT = TİC = 0) Nitelikli Öğr. Yet. Lİsesi Harcama = (b1 + dN) + b2N + u (NİT= 1; TEK = TİC = 0) Ticaret Lisesi Harcama = (b1 + dTİ) + b2N + u (TİC = 1; TEK = NİT = 0) Benzer şekilde gözlem nitelikli öğrenci yetiştiren lisesi yada Ticaret lisesi ise, regresyon denklemleri yukarıda gösterildiği gibi oluşturulmaktadır.

51 Harcama N b1+dT b1+dN b1+dTİ b1 Nitelikli Ticaret dN dTİ dT Teknik Genel Yukarıdaki diyagram modeli grafiksel olarak göstermektedir. d katsayısı; teknik, nitelikli ve ticaret lisesi için genel liseye göre ekstra gider harcamalarını ifade etmektedir.

52 Harcama N b1+dT b1+dN b1+dTİ b1 Nitelikli Ticaret dN dTİ dT Teknik Genel Dikkat edilecek olurda d katsayıların büyüklülüğü ve işaretleri için önceden bir varsayımda bulunulmamaktadır. Örnek verilerinden tahminlenecektir.

53 Okul Tip Harcama N TEK NİT TİC
1 Teknik 345, 2 Teknik 537, 3 Genel 170, 4 Nitelikli 5 Genel 100, 6 Ticaret 28, 7 Ticaret 160, 8 Teknik 45, 9 Teknik 120, 10 Nitelikli 61, Yukarıdaki tabloda 74 liseden 10 tanesine ait veriler gösterilmektedir. Her bir kukla değişken TEK, NİT ve TİC kukla değişkenleri okul tiplerine göre oluşturulmuştur.

54 Dağılma diyagramı yeni okulların verilerini göstermektedir.

55 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Verilere ait regresyon sonuçları tabloda gösterilmiştir. N in katsayısı her bir öğrenci için marjinal harcamayı ifade etmektedir ve yaklaşık 343 yuandır.

56 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama| Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | TEK, NİT ve TİC değişkenlerinin katsayıları 154,000, 143,000, ve 53,000 sırasıyla genel liselere göre ilave yıllık sabit harcamaları ifade etmektedir.

57 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Sabit terim genel liselerde sabit harcamaların yuan olduğunu söylemektedir.

58 Harcama = -55,000 + 154,000TEK + 143,000NİT+ 53,000TİC + 343N
^ En üsteki regresyon sonuçlarını göstermektedir. Her bir okul için harcama fonksiyonları ayrı ayrı gösterilecektir.

59 Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama= -55, N (TEK= NİT = TİC = 0) ^ ^

60 Harcama= -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55, N (TEK= NİT = TİC = 0) ^ ^ Öğrenci başına yıllık marjinal harcama 343 yuandır. Öğrenci başına yıllık sabit harcamalar her bir okul için -55,000 yuan olarak tahmin edilmiştir.

61 Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55, N (TEK= NİT = TİC = 0) Teknik Lise Harcama = -55, , N (TEK = 1; NİT = TİC = 0) = 99, N ^ ^ ^ Genel liseye göre teknik lisenin ekstra yıllık sabit harcaması 154,000 yuan olarak tahminlenmiştir.

62 Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55, N (TEK= NİT = TİC = 0) Teknik Lise Harcama = -55, , N (TEK = 1; NİT = TİC = 0) = 99, N Nitelikli Lisesi Harcama = -55, , N (NİT = 1; TEK = TİC = 0) = 88, N Ticaret Lisesi Harcama = -55, , N (TİC = 1; TEK = NİT = 0) = -2, N ^ ^ ^ ^ ^ Benzer şekilde nitelikli öğrenci yetiştiren ve ticaret okulunun genel liseye göre yıllık ekstra harcaması 143,000 and 53,000 yuandır.

63 Harcama = -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55, N (TEK = NİT = TİC = 0) Teknik Lise Harcama = -55, , N (TEK = 1; NİT = TİC = 0) = 99, N Nitelikli Lisesi Harcama = -55, , N (NİT = 1; TEK = TİC = 0) = 88, N Ticaret Lisesi Harcama = -55, , N (TİC = 1; TEK = NİT = 0) = -2, N ^ ^ ^ ^ ^ Dikkat edilirse öğrenci başına yıllık marjinal harcama 343 yuan olarak tahmin edilmiştir.

64 Dört harcama grafiği şekilde gösterilmiştir.
Teknik Lise Ticaret Lisesi Genel Lise Nitelikli Dört harcama grafiği şekilde gösterilmiştir.

65 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Bütün katsayılar için t-testi yapabiliriz. N değişkenin katsayısı için t istatistiği 8.52 ve bu da bize beklenildiği gibi marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir.

66 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK| NİT | TİC | _cons | Ayrıca teknik lise t-istatistiği katsayısı da istatistiksel olarak anlamlıdır. Bunun anlamı ise teknik lise yıllık sabit harcamalarının genel liselerin sabit harcamalarından oldukça büyük olduğunu göstermektedir.

67 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Benzer şekilde vasıflı NİT lerin t istatistiği 5.15 olarak bulunmuştur.

68 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Bununla birlikte Ticaret lisesinin t istatistiği sadece 1.71 dir ve bu da ticaret lisesi sabit harcamalarının genel lise sabit harcamalarında yeterince farklı olmadığını göstermektedir.

69 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Bu sonuç çok şaşırtıcı değil, çünkü ticaret lisesi genel liselerden çok farklı bir eğitime sahip değil.

70 . reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Son olarak kukla değişkenlerin ortak açıklayıcısı gücünü test etmek için F testi yapabiliriz. H0: dT = dN = dTİ = 0 olarak tanımlanabilir. Alternatif hipotez ise en az bir d sıfırdan farklıdır şeklinde kurulmaktadır.

71 Kukla değişkenli modelinde hata kareler toplamı 5.41×1011.
. reg Harcama N TEK NİT TİC Source | SS df MS Number of obs = F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Harcama| Coef. Std. Err t P>|t| [95% Conf. Interval] N | TEK | NİT | TİC | _cons | Kukla değişkenli modelinde hata kareler toplamı 5.41×1011.

72 Kukla değişkensiz modelin hata kareler toplamı 8.92×1011.
. reg Harcama N Source | SS df MS Number of obs = F( 1, 72) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = 1.1e+05 Harcama | Coef. Std. Err t P>|t| [95% Conf. Interval] N | _cons | Kukla değişkensiz modelin hata kareler toplamı 8.92×1011.

73 . reg Harcama N Source | SS df MS Number of obs = F( 1, 72) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = 1.1e+05 . reg Harcama N TEK NİT TİC F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = Değişkenlerin katsayılarına 0 sınırlaması konan genel F testi uygulanabilir..

74 . reg Harcama N Source | SS df MS Number of obs = F( 1, 72) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = 1.1e+05 . reg Harcama N TEK NİT TİC F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = f1 = c =3 f2 =n-k=74-5=69 F istatistiğinin payında hesaplanan RSS modeldeki kukla değişken sayısına bölünmektedir. Bir başka ifadeyle, modele eklenen yeni değişken sayısına bölünmektedir.

75 Source | SS df MS Number of obs = 74
. reg Harcama N Source | SS df MS Number of obs = F( 1, 72) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = 1.1e+05 . reg Harcama N TEK NİT TİC F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE =

76 F istatistiği değeri 14.92 olarak hesaplanmaktadır.
. reg Harcama N Source | SS df MS Number of obs = F( 1, 72) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = 1.1e+05 . reg Harcama N TEK NİT TİC F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = F istatistiği değeri olarak hesaplanmaktadır.

77 Source | SS df MS Number of obs = 74
. reg Harcama N Source | SS df MS Number of obs = F( 1, 72) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = 1.1e+05 . reg Harcama N TEK NİT TİC F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE =

78 H0 hipotezi redddilebilir
. reg Harcama N Source | SS df MS Number of obs = F( 1, 72) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = 1.1e+05 . reg Harcama N TEK NİT TİC F( 4, 69) = Model | e e Prob > F = Residual | e e R-squared = Adj R-squared = Total | e e Root MSE = H0 hipotezi redddilebilir

79 KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU
1.HAL: Sabit Terimlerin Farklı Eğimlerin Eşit olması = 79

80 KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU
2.HAL: Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali = 80

81 ) b2 + b3 b3 b1 Yi Xi 81

82 KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU
3.HAL: Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması 82

83 Yi Xi ) b4 b3+b4 b1 b1+b2 83

84 İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ
Eğim farkı Sabit terim farkı t testi ne bakılır. b3 katsayısı anlamsız ve b2 anlamlı ise 1.durum (sabit terim farklı eğimler aynı) -b2 katsayısı anlamsız b3 anlamlı ise 2. durum (sabit terim aynı eğimler farklı) her iki katsayı da anlamlı ise 3. durum (iki fonk. birbirinden farklıdır denir) 2. Chow Testi 84

85 İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ
Uygulama: Yıllık Sigara Tüketimi Cinsiyet (Di) (Erkek = 1, Kadın = 0) Yıllık Gelir (Xi) 25 1 400 20 260 19 270 24 360 240 22 310 21 280 18 200 320 85

86 İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ
Dependent Variable: Y Method: Least Squares Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C Di Xi DiX R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) Eğim Farkı Sabit Terim Farkı 86

87 Sonuç olarak İki sınıf tüketim fonksiyonlarının aynı olduğunu söyleyebiliriz.

88 BİR MODELDE KUKLA DEĞİŞKENLERİN KARŞILIKLI OLARAK BİRBİRİNİ ETKİLEMELERİ PROBLEMİ
Şehirde Oturan bir Erkeğin Tüketim Farkı Erkeğin Tüketim Farkı Şehirde Oturanların Tüketim Farkı 88

89 b4 katsayısının t istatistiğine bakılır
b4 katsayısının t istatistiğine bakılır. Şayet anlamlıysa iki kukla değişkenin modelde birlikte yer alması, bunların bireysel etkilerini azaltabilir veya arttırabilir. Bu durumda bu katsayının modelde yer almaması da spesifikasyon hatalarına yol açabilir.

90 Üçer Aylar Karlar (Milyon Dolar) Şatışlar 1965-I 10503 114862 II 12092
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Üçer Aylar Karlar (Milyon Dolar) Şatışlar 1965-I 10503 114862 II 12092 123968 III 10834 121454 IV 12201 131917 1966-I 12245 129911 14001 140976 12213 137828 12820 145465 D2 1 D3 1 D4 1 90

91 Dependent Variable: Kar
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Dependent Variable: Kar Variable Coefficient Std. Error t-Statistic Prob. C D D D Satış R2= İstatistiki olarak anlamsız 91

92 MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA
Dependent Variable: Kar Sample: 1965:1 1970:4 VariableCoefficient Std. Error t-Statistic Prob. C D Satış R2 = Mevsim dalgalanmalarının etkisinde 92

93 Parçalı Doğrusal Regresyon
Bir sigorta şirketi satış temsilcilerinin belli bir satış hacmini geçmesi durumunda çalışanlarına komisyon ödemektedir. Şirket içerisinde gerçekleştirilen satış komisyon ücretleri belli bir satış hacmi(X*) eşik düzeyine kadar doğrusal artmakta ve bu eşik düzeyinden sonra ise daha dik bir oranla satışlarla doğrusal olarak arttığı varsayılmaktadır. Bu durumda I ve II olarak numaralandırılmış iki parçadan oluşan parçalı doğrusal regresyona ve eşik düzeyinde eğimin değiştiği komisyon fonksiyonuna sahip olmuş oluruz. II Satış Komisyonları I X* X 93

94 Parçalı Doğrusal Regresyon
Satış Komisyonları Y X Satışlar Yi= a1 + b1Xi + b2 (Xi-X*)Di+ui Yi= Satış Komisyonları Xi= Satış Miktarı X*= Satışlarda Prim Eşik Değeri Di = 1 Eğer Xi > X* = 0 Eğer Xi < X* X* E(Yi| Di =0,Xi, X*) = a1 +b1 Xi E(Yi| Di =1,Xi, X*) = a1 - b2X* +(b1+ b2)Xi

95 Parçalı Doğrusal Regresyon
Satış Komisyonları Y X Satışlar b1+b2 1 b1 1 a1 X* a1-b2X*

96 Örnek Total Cost($) TC Output(units) Q Di 256 1000 414 2000 634 3000
Bir şirket satış temsilcilerinin belli bir satış hacmini geçmesi durumunda çalışanlarına prim ödemektedir. Total Cost($) TC Output(units) Q Di 256 1000 414 2000 634 3000 778 4000 1003 5000 1839 6000 1 2081 7000 2423 8000 2734 9000 2914 10000 Dependent Variable: TC Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C Q (Q-5500)*DI R2= F-statistic= [ ] İstatistiki olarak anlamsız Satışlardaki artışlar prim değerini arttırmamaktadır.

97 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
UYGULAMA: yıllarına arasında General Motor, Westinghouse ve General Electric firmalarna ait yatırım (Y), firmanın değeri (X2 ) ve sermaye stoğu (X3) verilerine ait tablo aşağıda verilmiştir. 97

98 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
Firmaların yatırımları arasında fark olup olmadığını inceleyebilmek için de kukla değişkenlerden yararlanabiliriz. Firmaların ilk üç yıllarına ait veriler ile oluşturulan yeni tablo aşağıdaki gibidir. Yıllar Y X2 X3 Di Firma 1935 317.6 3078.5 2.8 1 GM 1936 391.8 4661.7 52.6 1937 410.6 5387.1 156.9 12.93 191.5 1.8 WE 25.90 516.0 0.8 35.05 729.0 7.4 33.1 1170.6 97.8 GE 45.0 2015.8 104.4 77.2 2803.3 118.0 98

99 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
GM yatırımlarının diğer firma yatırımlarından sabit terim kadar farklı olduğunu ifade etmektedir.

100 ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
Dependent Variable: Y Method: Least Squares Included observations: 60 Variable Coefficient Std. Error t-Statistic Prob. C X X Di R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) GM yatırımları, diğer firma yatırımlarından farklı ve fazladır. İstatistiki olarak anlamlı 100

101 ÖRNEKLER 101

102 DATA7-19 1960-1988 yılları arasında Türkiye’deki Sigara Tüketimi
Q Yetişkinlerin sigara tüketim miktarı(kg), Range Y GNP(1968) TL, Range P Türkiye’deki sigara fiyatları Range ED1 Kayıtlı ortaokul ve lise mezunu nüfus oranı(12-17 yaş) Range ED2 Kayıtlı üniversite mezunu oranı (20-24) Range D82 = 1 , 1982 ve sonrası D86 = 1 , ve sonrası 102

103 Included observations: 29
Dependent Variable: Q Sample: Included observations: 29 Variable Coefficient Std. Error t-Statistic Prob. P ED ED D D Y C Katsayılar istatistiki olarak anlamsız 103

104 Included observations: 29
Dependent Variable: Q Method: Least Squares Sample: Included observations: 29 Variable Coefficient Std. Error t-Statistic Prob. ED D D Y C 104

105 DATA7-2 Belirli bir şirkette çalışan 49 kişinin istihdam durumu ve ücretleri WAGE = Aylık Ücret (Range ) EDUC = 8 yıllık eğitimden sonraki sahip olunan eğitim seviyesi(Range ) EXPER =Şirkette çalışma süresi(Range ) AGE = Yaş ( ) GENDER = 1, Erkek ise; 0 kadın ise RACE = 1, beyaz ise; 0 diğerleri CLERICAL = 1 büro memuru ise, 0 diğerleri MAINT = 1 bakım işlerinde çalışıyor ise; 0 diğerleri CRAFTS =1,usta ise; 0 diğerleri Temel sınıf Profesyonel meslek grupları. 105

106 Dependent Variable: WAGE Method: Least Squares
Included observations: 49 Variable Coefficient Std. Error t-Statistic Prob. C EDUC EXPER GENDER RACE CLERICAL MAINT CRAFTS R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) 106

107 DATA 7-9 1985 yılında koleje giriş yapan öğrencilerin ilk yıl başarılarını göstermekte colgpa = sonbaharındaki ortalamaları (Range ) hsgpa = Lise GPA (Range ) vsat = Sözel derecesi (Range ) msat = Sayısal derecesi (Range ) dsci = 1 Bilim dalı için, 0 diğerleri dsoc = 1 Sosyal bilim dallı için, 0 diğerleri dhum = 1 Beşeri bilimdalı için 0 diğerleri darts = 1 Sanat dalı için, 0 diğerleri dcam = 1 Öğrenci kampüste yaşıyorsa, 0 diğerleri dpub = 1 Genel lise mezunu ise, 0 diğerleri 107

108 Dependent Variable: COLGPA Method: Least Squares Sample: 1 427
Included observations: 427 Variable Coefficient Std. Error t-Statistic Prob. C HSGPA VSAT MSAT DSCI DSOC DHUM DARTS DCAM DPUB Katsayılar istatistiki olarak anlamsız 108

109 Dependent Variable: COLGPA
Variable Coefficient Std. Error t-Statistic Prob. C HSGPA VSAT MSAT 109


"KUKLA DEĞİŞKENLİ MODELLER" indir ppt

Benzer bir sunumlar


Google Reklamları