İKİ DEĞİŞKENLİ BASİT DOĞRUSAL REGRESYON MODELİ Regresyon Y ile X (X ler) arasındaki ortalama ilişkinin matematik fonksiyonla ifadesidir. Sabit terim Eğim X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini gösterir.
Y y2 ΔY= b2 ΔX y1 ΔX b1 X x1 x2 Doğrusal denklemin grafiği düz bir çizgi olup sabit ve eğim katsayılarını birbirinden ayırma özelliğine sahiptir. Sabit sayı X=0 olduğu zaman Y’nin alacağı azami değer ve eğim ise ΔY/ ΔX oranı olup X üzerindeki bir noktadan diğer bir noktaya olan hareketliliği göstermektedir.
b1 ve b2 hakkında bazı çıkarsamalar: Eğer b2 pozitif ise çizginin veya doğrunun eğimi soldan sağa yukarıya doğru; yok eğer negatif ise tersi geçerlidir. Eğer b2’in mutlak değeri büyükse doğru daha dik olmaktadır. Eğer b2= 0 ise doğru X eksenine b1 noktasında paralleldir. Bir çok fonksiyonlar düz çizgi halinde değildirler
0‘a göre türev alınırsa; 1‘e göre türev alınırsa; İfadesini minimize eden parametre tahmincilerinin değerlerini bulabilmek için eşitliğin 0 ve 1 ‘e göre türevleri alınıp 0’a eşitlenir. 0‘a göre türev alınırsa; 1‘e göre türev alınırsa; Her iki denklemi de 0’a eşitlersek;
Parantezleri açarsak; Bu denklemlere doğrunun NORMAL DENKLEMLERİ denir. Normal denklemler alt alta yazılıp birlikte çözüldüklerinde b0 ve b1 tahmincileri bulunur. şeklindeki formüller yardımıyla da tahminciler bulunabilir.
ÖRNEK REGRESYON DENKLEMİ Katsayıların Tahmini Normal Denklemler ile, Doğrudan Formüller ile, Ortalamadan Farklar ile,
Tüketim Gelir 75 80 88 100 95 120 125 140 115 160 127 180 165 200 172 220 183 240 225 260
SY = n + SX SXY= SX + SX2 SY=? , SX=? , SXY= ? , SX2= ? , n NORMAL DENKLEMLER SY = n + SX SXY= SX + SX2 SY=? , SX=? , SXY= ? , SX2= ? , n
X YX Y X2 75 88 95 125 115 127 165 172 183 225 80 100 120 140 160 180 200 220 240 260 6000 8800 11400 17500 18400 22860 33000 37840 43920 58500 6400 10000 14400 19600 25600 32400 40000 48400 57600 67600 SY=1370 SX=1700 SYX=258220 SX2=322000
NORMAL DENKLEMLER -170 / 1370 = 10 + 1700 258220 = 1700 + 322000 -232900 = -1700 - 289000 258220 = 1700 + 322000 25320 = 33000 = 0.7672727 = 6.5636364
ÖRNEK REGRESYON DENKLEMİ
DOĞRUDAN FORMÜLLER = 6.5636364
DOĞRUDAN FORMÜLLER = 0.7672727
ÖRNEK REGRESYON DENKLEMİ
ORTALAMADAN FARKLAR x=? Syx=? Sx2=? y=?
Ortalamalar Orijinine göre Örnek Regresyon Doğrusu (ÖRD)
SY=1370 SX=1700 Sy=0 Sx=0 ORTALAMADAN FARKLAR X Y 75 88 95 125 115 127 165 172 183 225 80 100 120 140 160 180 200 220 240 260 -62 -49 -42 -12 -22 -10 28 35 46 88 -90 -70 -50 -30 -10 10 30 50 70 90 SY=1370 SX=1700 Sy=0 Sx=0
yx x2 y2 Syx=25320 Sx2=33000 Sy2=20606 ORTALAMADAN FARKLAR 5580 3430 2100 360 220 -100 840 1750 3220 7920 8100 4900 2500 900 100 2500 4900 8100 3844 2401 1764 144 484 100 784 1225 2116 7744 Syx=25320 Sx2=33000 Sy2=20606
ORTALAMADAN FARKLAR = 0.7672727 =137-(0.7672).(170) = 6.5636364
ÖRNEK REGRESYON DENKLEMİ
ELASTİKİYETLERİN HESAPLANMASI Nokta Elastikiyet Ortalama Elastikiyet
NOKTA ELASTİKİYET X0 = 130
NOKTA ELASTİKİYET 0.94
ORTALAMA ELASTİKİYET = 0.95
Tahminin Standart Hatası ve Varyansı Tahminin standart hatası, regresyon doğrusu etrafındaki dağılımın bir ölçüsüdür. (n30 ise) (n<30 ise)
Tahminin Standart Hatası ve Varyansı
Tahminin Standart Hatası ve Varyansı Tüketim Gelir 75 88 95 125 115 127 165 172 183 225 7.0545 4.7091 -3.6364 11.0182 -14.3273 -17.6727 4.9818 -3.3636 -7.7091 18.9455 80 100 120 140 160 180 200 220 240 260 67.9455 83.2909 98.6364 113.9818 129.3273 144.6727 160.0182 175.3636 190.7091 206.0545 49.7666 22.1755 13.2231 121.4003 205.2707 312.3253 24.8185 11.3140 59.4301 358.9302 SY=1370 Se=0 Se2=1178.6545
Tahminin Standart Hatası ve Varyansı =12.138 s2= 147.3318 SY2 =? SY = ? SYX=? b1 =? b2 =? = 12.138
Tahminin Standart Hatası ve Varyansı Sy2 = ? Syx = ? b2= ? = 12.138
DEĞİŞKENLİKLER Y X Yi Xi
DEĞİŞKENLİKLER 3844 2401 1764 144 484 100 784 1225 2116 7744 4768.5302 2884.6664 1471.7686 529.8367 58.8707 49.7666 22.1755 13.2231 121.4003 205.2707 312.3253 24.8185 11.3140 59.4301 358.9302 Sy2=20600 Se2=1178.6545
DEĞİŞKENLİKLER 20606 = 19427.3455 + 1178.6545 Sy2 = Se2 + varyanslar 2575.75 = 2428.4182 + 141.3318
BELİRLİLİK KATSAYISI KORELASYON KATSAYISI Noktaların doğruya yakınlık derecesini göstermektedir. Y’deki değişmelerin yüzde kaçının X tarafından açıklanabildiğini ifade etmektedir. R2 0 ile 1 arasında değişmektedir. KORELASYON KATSAYISI Y ile X arasındaki ilişkinin yönünü ve şiddetini vermektedir. -1 ile +1 arasında yer almaktadır.
BELİRLİLİK KATSAYISI = 0.9428 = 0.9428 = 0.0572
Belirsizlik katsayısı
BELİRLİLİK KATSAYISI = 0.9428 = 0.9710
DAĞILMA DİYAGRAMLARI
STANDARTLAŞTIRILMIŞ HATA TERİMLERİ ei ei/s Xi 0.5812 0.38796 -0.29959 0.90774 -1.18037 -1.45598 0.41043 -0.27712 -0.63512 1.56084 80 100 120 140 160 180 200 220 240 260 7.0545 4.7091 -3.6364 11.0182 -14.3273 -17.6727 4.9818 -3.3636 -7.7091 18.9455
EKKY Varsayımları
Bağımlı Değişken Y nin Dağılımı Y bağımlı değişkeninin ortalaması Varyansı olduğu gösterilecektir.
1. Y nin ortalaması kendisinin beklenen değerine eşittir. Beklenen değer alındığında b1 ve b2 parametreler iken Xi değerleri değişmez değerler kümesinden geldikleri için bulunur.
Yi nin varyansı ve eşitliklerini varyans tanımında yerine koyarsak ui lar sabit varyanslıdır. Yani hepsinin varyansı sabit değerlidir. Yani
En Küçük Karalerle Parametre Tahminlerinin Ortalama ve Varyansı in ortalaması: in varyansı:
in ortalaması: in varyansı:
EKK Tahminlerinin Standart Hataları ve Kullanılışı EKK tahminleri ve örnek verilerine dayanarak hesaplanır. Bir anakütleden bir çok örnek çekilebilir, bu durumda her örnek seti için farklı tahminciler elde edilecektir. Örnek değerlerinin anakütle değerleri b1 ve b2 ye ne ölçüde yakın olduğu standart hatalarla hesaplanır. Standart hata, tahmincinin örnekleme dağılımının standart hatasıdır.
Bir tahmincinin örnekleme dağılımı anakütleden seçilebilecek aynı büyüklükteki örneklerin lerin dağılımıdır. (75 milyar) 60 hanelik anakütleden çekebileceğimiz onluk (75 milyar) örnek için hesaplanan değerlerinin örnekleme dağılımı ortalama etrafında normal dağılmaktadır. Anakütleden çekilen örnekler için hesaplanan EKK leri örneklerin farlı değerli Y(tüketim) ve X(gelir gibi) e sahip hanelerden oluşması gibi örnekleme hatalarından dolayı gerçek değerinden farklıdır.
Katsayıların Standart Hataları Örnekleme hataları + ve – yönde aynı ihtimalle ortaya çıkan hatalardır. Ortalama ölçüsü standart hatadır. Katsayıların Standart Hataları = 11.99 = 0.0668
Aralık Tahminleri ±t a/2 . s( ) = 0.7672727 2.306 (0.0668) 0.6132319< b2 <0.9213135 ± t a/2 . s( ) = 6.5636364 2.306 (11.99) -21.0853 < b1 < 34.2126
Hipotez Testleri Güven Aralığı Yaklaşımı İle 0.6132319< b2 <0.9213135 -21.0853 < b1 < 34.2126
Hipotez Testleri Anlamlılık Testi Yaklaşımı İle Hipotezlerin Formüle Edilmesi Tablo Değerlerinin Bulunması Test İstatistiğinin Hesaplanması Karar Verilmesi
Hipotez Testleri ta,sd =? t0.05,8=? =2.306 1.Aşama H0: b2 = 0 = 0.05 ; S.d.=? = n-k = 10-2=8 ta,sd =? t0.05,8=? =2.306 3.Aşama =11.4861 4.Aşama |thes= 11.4861 | > |ttab= 2.306 | H0 hipotezi reddedilebilir
Regresyon ve Varyans Analizi
Regresyon ve Varyans Analizi
EKK Modelinde Önceden Tahmin İleriye Ait Tahmin Önceden Tahmin Örnekten Tahmin Edilen İlişkinin Ayni Kaldığı X Değerlerinin Aynı Eğilimde Olacağı
Y’nin Aralık Tahmini
Y ˆ 33000 ) 80 ( 10 1 - + 170 Y’nin Aralık Tahmini 2 X0=80 = 67.9455 Y ˆ X0=80 = 67.9455 2 33000 ) 80 ( 10 1 - + 170 67.9455 ±2.306. (12.318) 35.47840 Y0| X0 100.41251
Y’nin Ortalamasının Aralık Tahmini - 2 1 ( X X ) ˆ + Y ± t . s a /2 n å 2 x
Y’nin Ortalamasının Aralık Tahmini Y ˆ X0=80 = 67.9455 2 33000 ) 80 ( 10 1 - + 170 67.9455 ±2.306. (12.318) 51.49402 E(Y0| X0) 84.39689
Y’nin Güven Aralıkları Y’ninAralık Tahminleri Y’nin OrtalamasınınAralık Tahminleri X0 Alt Sınır Üst Sınır Alt Sınır Üst Sınır 80.00 100.00 120.00 140.00 160.00 180.00 200.00 220.00 240.00 260.00 35.47840 52.01572 68.28577 84.26359 99.93034 115.27579 130.29996 145.01304 159.43390 173.58749 100.41251 114.56610 128.98696 143.70004 158.72421 174.06966 189.73641 205.71423 221.98428 238.52160 51.49402 69.33821 86.90184 103.99618 120.34284 135.68829 150.03254 163.62911 176.75639 189.60311 84.39689 97.24361 110.37089 123.96746 138.31171 153.65716 170.00382 187.09816 204.66179 222.50598
En Küçük Kareler Tahminlerinin Özellikleri 1. Tahmin Edicilerin Küçük Örnek Özellikleri Genellikle bir tahminin ana kütle parametresinin gerçek değerine yakın olması ve bu gerçek parametre yakınlarında dar bir aralıkta değişmesi istenir. Ana kütle parametresine ‘yakınlık’ çeşitli ekonometri tahmin yöntemleri ile bulunmuş tahminlerin örnekteki dağılımların ortalaması ve varyansıyla ölçülür.
En Küçük Kareler Tahminlerinin Özellikleri Burada her zamanki varsayımsal yenilemeli örnekleme süreci kullanılır, yani her biri n gözlemli çok sayıda örneğin alındığı varsayılır. Ekonometri yöntemlerinin her birini kullanarak her örnekten hesaplanıp dağılımları oluşturulur. Küçük örnekten bulunmuş iyi bir tahmin edici için temel ölçütler:Sapmasızlık, En küçük varyans, Etkinlik, Doğrusal en iyi, sapmasızlık (DES), En küçük ortalama hata karesi (OHK), Yeterlilik dir.
a. Sapmasız Tahmin Edici Bir tahmin edicinin sapması, beklenen değeriyle gerçek parametre arasındaki fark olarak tanımlanır. Sapma= -b Eğer sapma sıfırsa yani = b ise, sapmasız olur. Bu da örneklerin sayısı artıkça, sapmasız tahmin edicinin, parametrenin gerçek değerlerine yaklaştığı anlamına gelir. Sapmasız bir tahmin edici ‘ortalama olarak’ parametrenin gerçek değerini verir. Aranan bir özellik olmasına karşın, sapmasızlık kendi başına çok önemli değildir. Ancak küçük bir varyansla birleşirse önemli olur.
a. Sapmasız Tahmin Edici , b’nin sapmasız tahmin edicisidir , b’nin sapmalı tahmin edicisidir
b. En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici)… Bir tahmin, başka ekonometri yöntemleriyle bulunmuş başka herhangi bir tahminle karşılaştırıldığında en küçük varyansa sahip olduğu görülürse en iyi tahmindir. nin en iyi olma koşulu: < Ya da; Var( )<Var( ) Burada , gerçek parametre b nin (sapmasız olması gerekmeyen) herhangi bir başka tahminidir.
b. …En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici) Varyansı küçük olduğu halde sapması büyük olan bir tahmin edici, gerçek b parametresinden oldukça uzak bir değer etrafında toplanabilmektedir. , b nin büyük varyanslı sapmasız tahmin edicisidir. , b nin küçük varyanslı sapmalı bir tahmin edicisidir.
c. Etkin Tahmin Edici Bir tahmin edici; sapmasız ve başka herhangi sapmasız tahmin ediciyle karşılaştırıldığında daha düşük varyansa sahipse etkin tahmin edicidir. Aşağıdaki iki koşul yerine getirilirse etkindir: (i) ve Burada , gerçek b nin başka bir sapmasız tahmin edicisidir. Başka bir deyişle, etkin tahmin edici, bütün tahmin sapmasız ediciler sınıfı içinde en düşük (en iyi) varyansa sahip olan tahmin edicidir. (ii)
d. Doğrusal Tahmin Edici… Bir tahmin edici, örnekteki gözlemlerin doğrusal bir fonksiyonuysa doğrusal sayılır. Örnek gözlemleri veriyken, doğrusal bir tahmin edici şu biçimi alır: Burada ki ler sabit değerlerdir. Örneğin olduğundan örnek ortalaması doğrusal bir tahmin edicidir. Çünkü:
d...Doğrusal Tahmin Edici… örnek ortalaması hesaplanırken her gözleme, 1/n ye eşit olan aynı k ağırlığı verilmiştir.
e. Doğrusal en iyi sapmasız tahmin edici (DEST) Bir tahmin edici, doğrusalsa sapmasızsa ve gerçek b nin öteki doğrusal sapmasız tahmin edicileriyle karşılaştırıldığında en küçük varyansa sahipse, DEST olur.
f. En küçük ortalama hata kareli (OHK) tahmin edici Ortalama hata karesi ölçütü, sapmasızlık ve en küçük varyans özelliklerinin bir bileşimidir. Burada OHK, tahmin edicinin, ana kütledeki gerçek parametre b ile olan farkının karelesinin beklenen değeri olarak tanımlanır: OHK nin, tahmin edicinin varyansıyla sapma karesinin toplamına eşit olduğu gösterilebilir:
f… En küçük ortalama hata kareli (OHK) tahmin edici… İspat:
f. En küçük ortalama hata kareli (OHK) tahmin edici
g. Yeterli tahmin edici Yeterli bir tahmin edici, gerçek parametre hakkında bir örneğin içerdiği bütün bilgileri kullanıma koyan bir tahmin edicidir. Bu başka hiçbir tahmin edicinin, tahmin edilmekte olan gerçek ana kütle parametresi hakkında daha fazla bilgi sunamayacağı anlamına gelir.
2. Tahmin edicilerin büyük örnek özellikleri: Asimtotik özellikler Büyük örnek özelliklerinin, bir tahminin iyiliğini belirleme ölçütü olarak kullanılması, örneğin sonsuz büyük olmasını gerektirir. İşte bu nedenle bu özelliklere asimtotik özellikler denir. Örnek büyük olduğu zaman bu özelliklerin yaklaşık olarak sağlandığı varsayılır. Özellikler ise şunlardır: asimtotik sapmazlık, tutarlılık ve asimtotik etkinlik.
2...Tahmin edicilerin büyük örnek özellikleri: Asimtotik özellikler Asimtotik dağılım: Bir dizi rassal değişken düşünüldüğünde; Bunlardan her birinin kendi dağılımı, ortalaması ve varyansı vardır. Dağılımlar gitgide artan örnek büyüklüklerinden oluşturulmuştur. nT sonsuza giderken bu dağılımlar da belli bir dağılıma doğru yaklaşıyor olabilirler. İşte bu dağılıma {X(n)} dizisinin asimtotik dağılımı denir.
a. Asimtotik sapmasızlık… Eğer edicisinin asimtotik ortalaması, ana kütlenin gerçek b parametresine eşit ise, bu tahmin edici, bu parametrenin asimtotik sapmasız tahmin edicisidir. Bir tahmincinin asimtotik sapması, asimtotik ortalaması ile gerçek parametre arsındaki farka eşittir.
a… Asimtotik sapmasızlık Asimtotik bir sapmasız tahmin edici, örnek büyüklüğü yeterine büyük olduğunda sapması kaybolan bir tahmin edicidir. Eğer bir tahmin edici (sonlu küçük örneklerde) sapmasızsa aynı zamanda asimtotik sapmasızdır, ama bunun tersi doğru değildir.
asimtotik sapmasız olmalıdır. b. Tutarlılık… Bir edicisi, aşağıdaki iki koşulla, ana kütlenin b gerçek parametresinin tutarlı bir tahmin edicisidir: asimtotik sapmasız olmalıdır. 1. n sonsuza giderken 'nin varyansı sıfıra yaklaşmalıdır: 2.
Tutarlılık… Eğer varyans sıfırsa, dağılım ana kütlenin gerçek parametresinin üstünde bir noktada toplanır. Bir tahmin edicinin tutarlı olup olmadığını anlamak için, n arttıkça sapmanın ve varyansının ne olduğuna bakılmalıdır. (n) büyüdükçe hem sapma hem varyans azalmalı ve limitte ( iken) sıfır olmalıdır. Tutarlılık kavramı aşağıda çizilmiştir. Örnek büyüklüğü artıkça hem sapma hem varyans azalmaktadır.
c. Asimtotik etkinlik Eğer tutarlıysa Başka herhangi bir tutarlı tahmin ediciye göre daha küçük bir asimtotik varyansı varsa bu tahmin edici ana kütlenin gerçek b parametresinin asimtotik etkin bir tahmincisidir. Eğer; ise asimtotik etkindir. Burada , b nin başka bir tutarlı tahmin edicisidir. Tutarlı tahmin ediciler karşılaştırıldığında hangisinin varyansı daha hızla sıfıra yaklaşıyorsa o, asimtotik etkendir.
3. En Küçük Kareler Tahmin Edicilerinin Özellikleri Hata terimi u'nun bazı genel varsayımları yerine getirmesi, yani ortalamasının sıfır ve varyansının sabit olması koşuluyla, en küçük kareler tahmincilerinin DES ( doğrusal, en iyi, sapmasız) özelliklerini sağlamasına Gauss-Markow en küçük kareler teoremi denmektedir.
a. Doğrusallık En küçük kareler tahminleri ve gözlenen örnekteki Yi değerlerinin doğrusal fonksiyonlarıdır. Varsayım gereği Xi ler hep aynı değerlerle göründüklerine göre en küçük kareler tahminlerinin yalnız Y değerlerine bağlı olduğu gösterilebilir. İspat: Varsayım gereği X değerleri sabit değerler kümesidir. Bu durumda ki lerde örnekten örneğe değişmezler.
…Doğrusallık Bu durumda şunu yazabiliriz: Y’lerin doğrusal bir fonksiyonudur. Bağımlı değişken değerlerinin doğrusal bir bileşimidir. ve ki Örnekten örneğe değişmez. katsayı tahmini sadece Y ye bağlıdır.
ve nin sapmasızlık özelliği ve b. Sapmasızlık ve nin sapmasızlık özelliği ve şeklindedir. Bu özelliğin anlamı, örneklerin sayısı artıkça tahminler de parametrelerin gerçek değerine yaklaşır. Başka bir deyişle, n sayıda Y ve X gözleminden oluşan, olanak içindeki bütün örnekleri seçildiğinde ve ile tahminleri her örnek için hesaplandığında, bu tahminlerden çok fazla sayıda elde edilir. Bunların ortalaması ise ilişkinin parametrelerine eşit olur. Tahminlerin dağılımı, orta nokta olarak parametrenin gerçek b değeri üzerinde toplanacaktır.
c. En Küçük Varyans Gauss-Markow teoremi ispatı: Bu teoreme göre en küçük kareler tahminleri, başka ekonometri yöntemleriyle bulunmuş herhangi bir başka doğrusal sapmasız tahmin ediciler arasında en iyisidir ( varyansı en küçük olandır). EKK yönteminin tercih edilmesinin temel nedeni de bu özelliktir.
…VARYANS FORMÜLLERİNİN GENELLEŞTİRİLMESİ… 1) Tek açıklayıcı değişkenli model İki açıklayıcı değişkenli model
…VARYANS FORMÜLLERİNİN GENELLEŞTİRİLMESİ… Bir önceki ifadeler determinantla şöyle yazılabilir. Sapmalar biçiminde yazılmış iki açıklayıcı değişkenli modelin normal denklemleri şöyledir. Parantez içindeki terimler, örnek gözlemlerinden hesaplanmış determinantlardır ise bilinmeyenlerdir. Sağ tarafta yer alan bilinenler, determinant kalıbında yazılabilir. her bir parametrenin varyansı, bu parametreye ilişkin minör determinantının bütün determinanta bölümünün ile çarpımıdır.
…VARYANS FORMÜLLERİNİN GENELLEŞTİRİLMESİ… Öyleyse,
…VARYANS FORMÜLLERİNİN GENELLEŞTİRİLMESİ… 3) Üç açıklayıcı değişkenli model Normal denklemin sağ tarafında görülen bilinen terimlerin determinantı şöyledir:
…VARYANS FORMÜLLERİNİN GENELLEŞTİRİLMESİ…
…VARYANS FORMÜLLERİNİN GENELLEŞTİRİLMESİ… Katsayı tahminlerinin varyanslarını gösteren yukarıdaki ifadeler incelenecek olursa, şu genelleme yapılabilir. k sayıda açıklayıcı değişken içeren bir modelin tahminlerinin varyansı iki determinantın bir birine oranından hesaplanabilir. Örneğin nın varyansı aşağıdaki ifadedir.