İKİ DEĞİŞKENLİ BASİT DOĞRUSAL REGRESYON MODELİ Regresyon Y ile X (X ler) arasındaki ortalama ilişkinin matematik fonksiyonla ifadesidir. X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini gösterir. Sabit terimEğim
Y i deki değişim=[Düzenli değişim]+[Rassal değişim] Y i deki değişim=[Açıklanan değişim]+[Açıklanamayan değişim] Ekonometrik modelin ortaya çıkmasına sebep olan hata teriminin kaynakları: ÖLÇME HATALARI: Toplam tüketim ve milli gelir, kiralar ve hane gelirleri gibi değişkenlerin değerlerinden hareketle ekonometrik bir modeli tahmin ediyoruz. ‘‘Bu değerler nasıl tespit edilmektedir’’sorusunun cevabı bize ölçme hatalarını açıklayacaktır.
Tarım ve sanayi sektöründe üreticilerin fiyatlarını tespit ederken üreticiler yanlış beyanda bulunabilir. Yine hanelerle anket yaparken gelirlerini düşük beyan ederken, çeşitli mal ve hizmetler(kira,gıda,ulaştırma, vb.) yaptıkları harcama tutarlarını olduğundan fazla söyleyebilirler. İşte bu tür hatalara ölçme hataları veya sistematik hatalar denir. Bütün bu hatalar tüketim veya gelirler veyahut başka bir konuda topladığımız rakamların gerçeklerden sapmasına sebep olurlar ki bunların hepsine birden ölçme hataları denir.
C ve Y d değerleri gerçeğe nazaran (C+X) ve (Y d +Z) gibi sapmalı olacaktır. Böylece, C=a+bY d de ve tahmini değerleri, X ve Z sapmaları nisbetinde güvenilemez olacaktır. İktisat kanunlarının doğruluğu veya anlaşılabilmesi, istatistik verilerinin (tüketim,gelir, kira, nüfus miktarları ile ilgili rakamların) kalitesine, doğruluğuna ve elde bulunmasına bağlıdır.
Bu rakamların objektif ve doğru bir şekilde toplanamaması halinde ortaya çıkan ölçme hataları ortadan kaldırılamamaktadır. İstatistik ve ekonometride gerçekleştirilen tüm metodolojik yenilikler, bunların hatalı verilere uygulanması durumunda faydasız olacaktır. TOPLAMA HATALARI: Ekonomik analizlerde birbirinden farklı hane halklarına veya kişilere ait değerler toplanır ve bunların ortalaması hesaplanır.(toplam tüketim,ortalama tüketim,ortalama gelir gibi) Her ortalama ise serisini tek bir kıymetle ifade eden bir tahmindir.
Ortalama hesabı ile her hane veya birime ait değerler bir tek değere indirilmiş olmakta ve birimlerin kendi değerleri(özellikleri) kaybolmaktadır. En yüksek gelirli ile en düşük gelirli; en yüksek kira ödeyenle en az kira ödeyen ortalama gelir veya ortalama kira tutarı ile bir tutulmaktadır. Burada bir hata olduğu açıktır, bu hatalarada ‘‘toplama hataları denilmektedir.’’
ÖRNEKLEME HATALARI(TESADÜFİ HATALAR, STOKASTİK HATALAR): Memurların dalgınlığı veya dikkatsizliği sonucu bazı rakamların yanlış yazılması ile ortaya çıkan hatalarla örnekleme yapılması sebebiyle ortaya çıkan hataları kapsar. Örneğin, Türkiye’de ortalama kirayı bulabilmek için, toplam 3 milyon kiracıdan %1’ini (30bin) seçerek örnekleme yapılabilir. %1 örnekleme yerine binde bir yani 3bin kiracı alabiliriz veya 12 yıllık dönem yerine 25 yıllık dönem alabiliriz.
Bu farklı hane sayısı veya yıl sayısı (örnek büyüklüğü) ile yapılacak kira ve tüketim fonksiyonları için farklı katsayılar (a ve b’ler) bulunacaktır. Muhtelif örnekler arasında, örneğe giren birimlerin kiraları arasındaki farklılıklar sebebiyle ortaya çıkan tahmin farklılıkları örnekleme hatalarını oluşturur. Bu hatalar artı ve eksi iki yönlüdür. Yani mümkün olan bütün örnekler çekildiği ve kira fonksiyonu tahmin edildiğinde, ve ’lerin bir kısmı anakütle gerçek b 1 ve b 2 katsayılarından küçük; bir kısmının da bu anakütle değerlerinden büyük ve dağılımlarının normal olduğu görülür.
Bu sebeple üç milyonluk anakütleden çekilebilecek tüm örneklerin, katsayı tahminleri hesaplanır ve ayrı ayrı ortalamaları veya beklenen değerleri hesaplanırsa, ve (marjinal kira tüketim eğilimi)’dır. Ölçme hataları, ortadan kaldırılmadığı halde örnekleme hataları iki yönlü (artı ve eksi) olduklarından birbirinin tesirini ortadan kaldırabilirler.
SPESİFİKASYON HATALARI: İktisadi teori,gerçeğin bilerek basitleştirilmiş şeklidir. Toplam tüketim sadece harcanabilir gelire bağlı değildir, tüketicilerin zevkleri, fiyatlar seviyesi, servet gelir dağılımı, yaş piramidi, tüketicilerin son zamanlardaki gelir durumu gibi diğer bazı bağımsız değişkenlerede bağlıdır. Modele tüm bu değişkenleri alabilsek bile-ki uygulamalarda veri noksanlığı gibi sebeplerle bu mümkün olamamaktadır- değişkenler arasındaki ilişki C=a+b Y d şeklinde doğrusal olmayabilir.
Gerçek ilişki; gibi veya daha karmaşık bir ilişki olabilir. Veya tüketim fonksiyonu böyle tek denklemli değilde, 6 denklemli bir model olarak çözülmesi gerekebilir. Bütün bu sebeplerden ortaya çıkan hatalar “spesifikasyon hataları” denilmektedir. Bu hatalar ekonometrik bir araştırmada ilk olarak göz önünde tutulması gereken hatalardır.
.... y4y4 y1y1 y2y2 y3y3 x1x1 x2x2 x3x3 x4x4 } } { { u1u1 u2u2 u3u3 u4u4 x y E(y|x) = 0 + 1 x
y2y2 y1y1 x2x2 x1x1 Y X ΔXΔX ΔY= b 2 ΔX Doğrusal denklemin grafiği düz bir çizgi olup sabit ve eğim katsayılarını birbirinden ayırma özelliğine sahiptir. Sabit sayı X=0 olduğu zaman Y’nin alacağı azami değer ve eğim ise ΔY/ ΔX oranı olup X üzerindeki bir noktadan diğer bir noktaya olan hareketliliği göstermektedir. b1b1
b 1 ve b 2 hakkında bazı çıkarsamalar: Eğer b 2 pozitif ise çizginin veya doğrunun eğimi soldan sağa yukarıya doğru; yok eğer negatif ise tersi geçerlidir. Eğer b 2 ’in mutlak değeri büyükse doğru daha dik olmaktadır. Eğer b 2 = 0 ise doğru X eksenine b 1 noktasında paralleldir. Bir çok fonksiyonlar düz çizgi halinde değildirler
Örneğin: 4000 nüfuslu bir kasabada 500 hane bulunsun ve bunlardan sadece 60’ı memur olsun. Anakütle Regresyon Denklemi
Örnek Regresyon Denklemi
İfadesini minimize eden parametre tahmincilerinin değerlerini bulabilmek için eşitliğin 0 ve 1 ‘e göre türevleri alınıp 0’a eşitlenir. Her iki denklemi de 0’a eşitlersek; 0 ‘a göre türev alınırsa; 1 ‘e göre türev alınırsa; En Küçük Kareler Denklemleri
Parantezleri açarsak; Bu denklemlere doğrunun NORMAL DENKLEMLERİ denir. Normal denklemler alt alta yazılıp birlikte çözüldüklerinde b 0 ve b 1 tahmincileri bulunur. şeklindeki formüller yardımıyla da tahminciler bulunabilir.
Ortalamadan Sapmalar Yoluyla En Küçük Kareler Denklemlerinin İspatı olduğundan
Bu ifadenin her iki tarafını n ile böldüğümüzde Elde edilen ifade çıkarılırsa ; Veya elde edilir. Bu eşitlik ortalamalar orjinine g ö re regresyon denklemidir.
Ortalamalar orjinine göre regresyon denkleminden tahmini anakütle regresyon denklemi şöyle yazılabilir: elde edilir. olmak üzere, Hata terimleri kareleri toplamı şu şekilde ifade edilebilir:
Bu ifadenin ‘e göre türevi alınıp sıfıra eşitlendiğinde; elde edilir. için diğer bir formül ise şöyledir:
Basit En Küçük Kareler Regresyon Modelinin Varsayımları Varsayım 1: Hata terimi ortalaması sıfıra eşit stokastik bir değişkendir: Hata terimi u, pozitif ve negatif her iki yöndeki çok sayıda sebeplerin toplamının etkisini göstermektedir. Bu sebepten anakütle hata terimi u, X’in her değeri için şansa bağlı olarak pozitif, negatif veya sıfır değerlerini belli bir ihtimalle alabilmektedir. Yani u stokastik bir değişkendir ve değerleri önceden kesin olarak bilinmemektedir.
Bazı bağımsız değişkenlerin modele alınamaması, modelin matematiksel biçiminin yanlış seçilmiş olması, değişkenlerdeki ölçme hataları, fertlerin davranışlarının yaradılış icabı farklı olması gibi durumlar u’nun artı değer alabileceği gibi eksi değer de alabileceğini gösterir. Modele dahil edilmeyen değişkenlerin etkisi, bazen Y’yi gözlenebilecek olan değerinden daha büyük bazen de daha küçük değerli yapabilecektir. Yani genelde, sürekli olarak artış yönünde veya sürekli olarak azalış yönünde olan sapmalar(farklar) beklenmeyecektir. Bu da u’nun stokastik olduğu anlamına gelir.
u’lar sürekli artan veya sürekli azalan bir görünüm arzetmezler, düzensiz bir görünüm sergilerler. Ayrıca, u i nin muhtelif değerleri birbirinden bağımsız stokastik değişkenlerdir. Tüketim örneğinde, u’nun stokastik ve değerlerinin birbirinden bağımsız olması şöyle açıklanabilir: Bir hane için u i hata terim değerini pozitif elde etme ihtimali ne artar, ne de azalır. Ayrıca u hata terimi değerlerinin dağılımının normal, ortalamasının sıfır ve varyansının olduğunu varsayacağız.
Sonuç olarak, yazılabilir. Yani u i ler, birbirinden bağımsız, sıfır ortalamalı, eş,t varyanslı normal dağılımlıdır.
Varsayım 2: Hata terimi u normal dağılımlıdır: EKK tahmincilerinin ihtimal dağılımları, u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır. Bu sebepten b tahminleri konusunda bir test uygulamak gerektiğinde (t,F testi gibi)dağılımlarının normal olması gerekir, bu da u i nin dağılımının normal olmasını gerektirmektedir. Uygulamalarda anakütle u değerleri bilinmediğinden, Merkezi Limit Teoremi’ne göre normal dağıldıkları kabul edilir.
u i değerleriE(u i )=0 u’ların normal dağılımı
Normal dağılım eğrisinde, absiste u’nun ortalamasına (0) tekabül eden noktadan çıkılacak dikmenin iki tarafı tam bir simetri arzeder. u i normal dağılıyorsa, EKK nin tahmincileride normal dağılırlar. Uygulamalarda u’nun dağılımının normal olup olmadığı, Lilliefors grafik testi, χ 2 uygunluk testi ve Jarque-Bera testi ile araştırılmaktadır.
Varsayım 3: Hata terimi u i değerleri arasında ilişki(otokorelasyon) yoktur: u’nun herhangi bir u i değeri kendisinden önceki u j değeri ile bağımlı değildir. Bu varsayım u i ve u j nin kovaryanslarının sıfıra eşit olmasını gerektirir: Kov(u i,u j )=E[u i – E(u i )] [E[u j – E(u j )] varsayım 1’e göre E(u i )=E(u j )=0’dır. O halde, Kov(u i,u j )=E(u i u j )=0, i≠j Bu varsayım, Kov(Y i,Y j )=0, i≠j varsayımı demektir.
Varsayım 4: Hata terimi u i nin varyansı eşittir,sabittir. (homoskedastiklik veya eşit varyanslılık) u i nin varyansının her X i için eşit olduğu varsayımı şöyle ifade edilmektedir: Var(u i │X i )= E[u i – E(u i )] 2 Varsayım 1’e göre E(u i )=0 olduğundan, Var(u i │X i )= E[u i 2 ] Var(u i │X i )=σ 2 veya Var(u i )=σ 2 (1) (1) eşit varyanslık halini göstermektedir.
Bu varsayımın anlamı şudur: Her X i değeri için hata terimi u i ’nin varyansı belli bir sabit sayı olup σ 2 ’ye eşittir. Buna homoskedastiklik varsayımı, veya eşit(homo) dağılan(skedastik), veya eşit varyans varsayımı da denir.
Varsayım 5: Bağımsız değişken X, hata terimi u ile ilişkili olmayıp, stokastik değildir: Bağımsız değişken X i ile hata terimi u i arasında ilişki yoktur, yani kovaryansları sıfıra eşittir: Kov(u i, X i )= E[u i – E(u i )] [X i – E(X i )] Kov(u i,X i )=0 X değişkeninin birden fazla olduğu çoklu modellerde de u i ile her X değişkeni arasındaki kovaryans sıfıra eşit olmalıdır: Kov(u i,X 2 )=Kov(u i,X 3 )=0
Bu varsaymın anlamı şudur: Anakütle Regresyon Denkleminde X i ve u’nun Y’ye etkisi ayrıayrıdır(toplanabilirdir). Eğer, X ile u arasında ilişki varsa, herbirinin Y bağımlı değişkeni üzerindeki etkisini ferdi olarak takdir edemeyiz. Eğer X ile u arasında aynı yönde pozitif ilişki varsa, u artarken X’de artacak ve u azalırken X’de azalacaktır. Benzer şekilde X ile ters yönde negatif ilişkili iseler, u azalırken X artar ve u artarken X azalır. Bu nedenle, X ve u’nun Y üzerindeki etkisinin tahmini mümkün olmayacaktır.
Varsayım 6: Bağımsız değişken X, tekrarlı örneklere göre sabittir. X i ile u i arasında ilişki olmaması yani Kov(u i, X i )=0 varsayımı X’in stokastik bir değişken olmamasını (tesadüfi dağılmasını) gerektirir. Bu da istatistiki olarak, anakütleden çekilebilecek tüm örnekler için X değerlerinin sabit değerli olduğunu gösterir.(aynı X değişkeni değerleri için ayrı Y değerleri sözkonusu.) Şöyleki: Kov(u i, X i )= E[u i – E(u i )] [X i – E(X i )] Varsayım 1’e göre E(u i )=0 olduğundan:
Kov(u i, X i )= E[u i (X i – E(X i )] = E[u i X i – u i E(X i )] X i ‘ler sabit kabul edilirse, E[E(X i )]=E(X i ) Kov(u i, X i )= E(u i X i )– E(u i )E(X i ) Varsayım 1’ e göre E(u i )=0’dır. Yani; Kov(u i, X i )= E(u i X i ) = 0 (Varsayım 5 gereği)
Varsayım 7: Bağımsız değişken X’in varyansı sonlu pozitif bir sayı olmalıdır. Anakütleden çekilebilecek örneklerin herbiri için X değişkeni değerlerinin sabit kabul edilmesi,X değişkeninin tüm değerlerinin eşit olması demek değildir. Buna rağmen X değerlerinin aynı zamanda eşit olması halinde,
Burada tüm X değerleri eşit ise ‘dır ve payda olacaktır. Böylece sabit/0= olacağından ve dolayısıyla tahmin edilemeyecektir. Yani, Sonlu olmalıdır. Burada Q sonlu pozitif sabit bir sayıyı göstermektedir.
Varsayım 8: Modelin spesifikasyonu doğrudur. İki değişkenli doğrusal regresyon modelinin EKK ile tahmininde kabul edilen en önemli varsayımlardan biri regresyon modelinin spesifikasyonunun doğru yapıldığı, modelin spesifikasyon hatası taşıyıp taşımadığıdır. Modele bazı değişkenlerin alınmaması, eğrisel bir fonksiyon alınması gerekirken doğrusal fonksiyon alınması, model değişkenleri konusunda hatalı varsayımlar yapılması hallerinde tahmin edilen fonksiyon güvenilir olmayacak, spesifikasyon hatalı olacaktır.
Varsayım 9: Bağımsız değişkenler arasında İlişki yoktur. (Çoklu doğrusal Bağlantı olmaması Varsayımı) EKKY’nin bu varsayımı, birden fazla bağımsız değişkeni olan çoklu modellerle ilgilidir. Bu varsayıma göre,çoklu modellerde bağımsız değişkenler arasında ilişki yoktur.
Bağımlı Değişken Y nin Dağılımı Y bağımlı değişkeninin ortalaması Varyansı olduğu gösterilecektir.
1. Y nin ortalaması kendisinin beklenen değerine eşittir. Beklenen değer alındığında b 1 ve b 2 parametreler iken X i değerleri değişmez değerler kümesinden geldikleri için bulunur.
2. Y i nin varyansı ve eşitliklerini varyans tanımında yerine koyarsak u i lar sabit varyanslıdır. Yani hepsinin varyansı sabit değerlidir. Yani
3. Y i nin dağılımı normaldir. Y i nin dağılımının biçimi, u i nin dağılımının biçimiyle belirlenir ve bu dağılım varsayım gereğince normaldir. b 1 ve b 2 sabit parametreler olmaları nedeniyle Y i nin dağılımını etkilemezler. Ayrıca X i açıklayıcı değişkenin değerleri de varsayım gereğince değişmez değerler kümesinde olduğundan Y i nin dağılım biçimini etkilemezler.
ÖRNEK REGRESYON DENKLEMİ Katsayıların Tahmini §Normal Denklemler ile, §Doğrudan Formüller ile, §Ortalamadan Farklar ile,
Tüketim Gelir
NORMAL DENKLEMLER Y = n + X XY= X + X 2 Y=?, X=?, XY= ?, X 2 = ?, n
Y XYX X2X Y=1370 X 2 = X=1700 YX=258220
NORMAL DENKLEMLER = 10 + = + -170 / - = = + = = =
ÖRNEK REGRESYON DENKLEMİ
= DOĞRUDAN FORMÜLLER
=
ÖRNEK REGRESYON DENKLEMİ
ORTALAMADAN FARKLAR yx=? x 2 =? y=? x=?
Ortalamalar Orijinine göre Örnek Regresyon Doğrusu (ÖRD)
Y X Y=1370 x=0 X=1700 y=0 ORTALAMADAN FARKLAR
x2x2 yx y2y2 yx=25320 x 2 =33000 y 2 =20606
ORTALAMADAN FARKLAR = = =137-(0.7672).(170)
ÖRNEK REGRESYON DENKLEMİ
ELASTİKİYETLERİN HESAPLANMASI Nokta Elastikiyet Ortalama Elastikiyet
NOKTA ELASTİKİYET X 0 = 130
NOKTA ELASTİKİYET 0.94
ORTALAMA ELASTİKİYET = 0.95
Tahminin Standart Hatası ve Varyansı (n 30 ise) (n<30 ise) Tahminin standart hatası, regresyon doğrusu etrafındaki dağılımın bir ölçüsüdür.
Tahminin Standart Hatası ve Varyansı
Tüketim Gelir Y=1370 e=0 e 2 =
Tahminin Standart Hatası ve Varyansı = s 2 = Y 2 =? Y = ? YX=? b 1 =?b 2 =? =
Tahminin Standart Hatası ve Varyansı y 2 = ? yx = ? b 2 = ? =
DEĞİŞKENLİKLER Y X YiYi XiXi
y 2 =20600 e 2 =
DEĞİŞKENLİKLER y2y2 = e2e = = varyanslar
BELİRLİLİK KATSAYISI Noktaların doğruya yakınlık derecesini göstermektedir. Y’deki değişmelerin yüzde kaçının X tarafından açıklanabildiğini ifade etmektedir. R 2 0 ile 1 arasında değişmektedir. KORELASYON KATSAYISI Y ile X arasındaki ilişkinin yönünü ve şiddetini vermektedir. -1 ile +1 arasında yer almaktadır.
BELİRLİLİK KATSAYISI = =
Belirsizlik katsayısı
BELİRLİLİK KATSAYISI = =
DAĞILMA DİYAGRAMLARI
STANDARTLAŞTIRILMIŞ HATA TERİMLERİ eiei e i /s XiXi
EKK Tahminlerinin Standart Hataları ve Kullanılışı EKK tahminlerive örnek verilerine dayanarak hesaplanır. Bir anakütleden bir çok örnek çekilebilir, bu durumda her örnek seti için farklı tahminciler elde edilecektir. Örnek değerlerinin anakütle değerleri b 1 ve b 2 ye ne ölçüde yakın olduğu standart hatalarla hesaplanır. Standart hata, tahmincinin örnekleme dağılımının standart hatasıdır.
Bir tahmincinin örnekleme dağılımı anakütleden seçilebilecek aynı büyüklükteki örneklerin lerin dağılımıdır. (75 milyar) 60 hanelik anakütleden çekebileceğimiz onluk (75 milyar) örnek için hesaplanan değerlerinin örnekleme dağılımı ortalama etrafında normal dağılmaktadır. Anakütleden çekilen örnekler için hesaplanan EKK leri örneklerin farlı değerli Y(tüketim) ve X(gelir gibi) e sahip hanelerden oluşması gibi örnekleme hatalarından dolayı gerçek değerinden farklıdır. Örnekleme hataları + ve – yönde aynı ihtimalle ortaya çıkan hatalardır. Ortalama ölçüsü standart hatadır.
En Küçük Karalerle Parametre Tahminlerinin Ortalama ve Varyansı ’in ortalaması: ’in varyansı:
’nin ortalaması: ’n'in varyansı:
EKK’de Parametre Tahminlerinin Ortalama ve Varyansı ’nin Ortalamasının İspatı: Y=b 1 +b 2 X ’nin ortalaması=E( )=b 2 eşitliğini yerine koyalım,
olduğundan, Varsayım gereği x değerleri sabittir. Bunun sonucu olarak oranıda örnekten örneğe aynı kalır. Bu orana k diyecek olursak, ’nin tahminini şu biçimde gösterebiliriz:
Y=b 1 +b 2 X+u eşitliğindeki Y i ’yi burada yerine koyar ve bulduğumuz ifadeyi yeniden düzenlersek; (∑k=0 ∑kX=1) ∑k=0 için ispat:
∑kX=1 için ispat: Pay için; Payda için;
Bu nedenle;
’nin varyansı: Şu ifadenin doğruluğu ispatlanabilir: İspat:
§ ’in ortalaması için ispat:
n,k ve x ortalamanın örnekten örneğe sabit kaldığını düşünürsek ve ide yerine koyarsak; Y=b 1 +b 2 X’
’ in Varyansı: İspat:
olduğundan;
dir.
Katsayıların Standart Hataları = =
Aralık Tahminleri ± t /2. s( ) = (0.0668) < 2 < = (11.99) < 1 <
Hipotez Testleri < 2 < < 1 < Güven Aralığı Yaklaşımı İle
Hipotez Testleri Anlamlılık Testi Yaklaşımı İle Hipotezlerin Formüle Edilmesi Tablo Değerlerinin Bulunması Test İstatistiğinin Hesaplanması Karar Verilmesi
Hipotez Testleri 1.Aşama H 0 : 2 = 0 H 1 : 2 0 2.Aşama = ? = 0.05 ;S.d.=?= n-k= 10-2=8 3.Aşama t ,sd =?t 0.05,8 =?=2.306 = Aşama|t hes = | > |t tab = | H 0 hipotezi reddedilebilir
Regresyon ve Varyans Analizi
EKK Modelinde Önceden Tahmin İleriye Ait Tahmin Önceden Tahmin Örnekten Tahmin Edilen İlişkinin Ayni Kaldığı X Değerlerinin Aynı Eğilimde Olacağı
Y’nin Aralık Tahmini
0 Y ˆ X 0 =80 = ± )80( Y 0 | X 0
Y’nin Ortalamasının Aralık Tahmini 0 Y ˆ ± t /2. s 2 2 0 x )XX( n 1
Y’nin Ortalamasının Aralık Tahmini 0 Y ˆ X 0 =80 = ± )80( 10 1 E(Y 0 | X 0 )
Y’nin Güven Aralıkları X0X0 Alt SınırÜst Sınır Alt Sınır Y’ninAralık TahminleriY’nin OrtalamasınınAralık Tahminleri
En Küçük Kareler Tahminlerinin Özellikleri Genellikle bir tahminin ana kütle parametresinin gerçek değerine yakın olması ve bu gerçek parametre yakınlarında dar bir aralıkta değişmesi istenir. Ana kütle parametresine ‘yakınlık’ çeşitli ekonometri tahmin yöntemleri ile bulunmuş tahminlerin örnekteki dağılımların ortalaması ve varyansıyla ölçülür. 1. Tahmin Edicilerin Küçük Örnek Özellikleri
§Burada her zamanki varsayımsal yenilemeli örnekleme süreci kullanılır, yani her biri n gözlemli çok sayıda örneğin alındığı varsayılır. Ekonometri yöntemlerinin her birini kullanarak her örnekten hesaplanıp dağılımları oluşturulur. §Küçük örnekten bulunmuş iyi bir tahmin edici için temel ölçütler:Sapmasızlık, En küçük varyans, Etkinlik, Doğrusal en iyi, sapmasızlık (DES), En küçük ortalama hata karesi (OHK), Yeterlilik dir. En Küçük Kareler Tahminlerinin Özellikleri
a. Sapmasız Tahmin Edici §Bir tahmin edicinin sapması, beklenen değeriyle gerçek parametre arasındaki fark olarak tanımlanır. Sapma= -b §Eğer sapma sıfırsa yani = b ise, sapmasız olur. Bu da örneklerin sayısı artıkça, sapmasız tahmin edicinin, parametrenin gerçek değerlerine yaklaştığı anlamına gelir. Sapmasız bir tahmin edici ‘ortalama olarak’ parametrenin gerçek değerini verir. §Aranan bir özellik olmasına karşın, sapmasızlık kendi başına çok önemli değildir. Ancak küçük bir varyansla birleşirse önemli olur.
§, b’nin sapmalı tahmin edicisidir §, b’nin sapmasız tahmin edicisidir a. Sapmasız Tahmin Edici
En Küçük Kareler Tahmin Edicilerinin Doğrusallıkları ve Sapmasızlıkları ve (1) olup bu da bize ’ in doğrusal bir tahmin edici olduğunu gösterir, çünkü Y’nin doğrusal bir fonksiyonudur. Aslında ‘ ler tartı olarak alındığında ‘ in Y’nin tartılı ortalaması olduğu söylenebilir. Benzer biçimde gösterilebileceği gibi, ’de doğrusal bir tahmin edicidir.
Sırası gelmişken ’lerin şu özelliklerini görelim: 1) ’lerin olasılıklı olmadığı varsayıldığına göre ’ler de olasılıklı değildir. 2) 3) 4) Bu özellikler ’nin tanımından doğrudan türetile- bilir.
Örnek olarak; (verili bir örneklem için bilindiği ve ortalama- dan sapmalar toplamı hep sıfır olduğu için) Şimdi biçimindeki anakütle regresyon fonksiyonunu (ARF) denklem (1) de yerine koyalım:
(2) Burada ’ nin daha önce sözü edilen özelliklerinden yararlanılmıştır. Şimdi de denklem (2)’nin her iki yanının beklenen değerini alalım., olasılıklı olmadığı için ’yi sabit gibi düşünür ve varsayım gereği olduğunu göz önünde bulundurursak;
sonucunu elde ederiz. Öyleyse,, ’nin sapmasız bir tahmin edicisidir. Benzer biçimde kanıtlanabileceği gibi, ’nin sapmasız bir tahmin edicisidir.
b. En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici)… Bir tahmin, başka ekonometri yöntemleriyle bulunmuş başka herhangi bir tahminle karşılaştırıldığında en küçük varyansa sahip olduğu görülürse en iyi tahmindir. nin en iyi olma koşulu: < Ya da; Var( )<Var( ) Burada, gerçek parametre b nin (sapmasız olması gerekmeyen) herhangi bir başka tahminidir.
§Varyansı küçük olduğu halde sapması büyük olan bir tahmin edici, gerçek b parametresinden oldukça uzak bir değer etrafında toplanabilmektedir., b nin büyük varyanslı sapmasız tahmin edicisidir., b nin küçük varyanslı sapmalı bir tahmin edicisidir. b. …En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici)
en küçük kareler tahmin edicisinin hem sapmasız hem doğrusal olduğu gösterilmişti. (aynı şey için de geçerlidir.) Bu tahmin edicilerin, bütün doğrusal sapmasız tahmin ediciler içinde en düşük varyanslılar olduğunu gösterebilmek için, en küçük kareler tahmin edicisini ele alalım: En Küçük Kareler Tahmin Edicilerinin En Küçük Varyans Özelliği
Burada, biçimindedir. Bu da bize, tartı görevi görmek üzere, ‘nin Y’lerin tartılı ortalaması olduğunu gösterir. ‘nin başka bir doğrusal tahmin edicisini şöyle tanımlayalım: olsun.
Buradaki w i ‘ler tartılıdır fakat ‘lere eşit olması gerekmez. Dolayısıyla ‘nın sapmasız olabilmesi için şunların sağlanması gerekir:
Ayrıca şöyle de yazabiliriz: (Açıklama: )
( matematik hilesine dikkat edin) (3) Burada, sondan ikinci satırın en son terimi ortadan kayboldu.(Neden?)
(3) denkleminin son terimi sabit olduğundan nin varyansı ilk terimle oynayarak en düşüğe indirgenebilir. yazarsak (3) eşitliği şuna indirgenir;
Sözle belirtirsek “w i tartıları = k i en küçük kareler tartıları” iken, doğrusal tahmin edicisinin varyansı, en küçük kareler tahmin edicisinin varyansına eşittir; tartılar eşit değilse ; olur. Bir başka deyişle; eğer ‘nin en küçük varyanslı sapmasız, doğrusal bir tahmin edicisi varsa o da en küçük kareler tahmin edicisidir. Benzer biçimde gösterilebileceği gibi, ‘de β 1 ’in en küçük varyanslı, sapmasız, doğrusal bir tahmin edicisidir. β2β2
c. Etkin Tahmin Edici §Bir tahmin edici; sapmasız ve başka herhangi sapmasız tahmin ediciyle karşılaştırıldığında daha düşük varyansa sahipse etkin tahmin edicidir. §Aşağıdaki iki koşul yerine getirilirse etkindir: (i) ve §Burada, gerçek b nin başka bir sapmasız tahmin edicisidir. Başka bir deyişle, etkin tahmin edici, bütün tahmin sapmasız ediciler sınıfı içinde en düşük (en iyi) varyansa sahip olan tahmin edicidir. (ii)
d. Doğrusal Tahmin Edici… §Bir tahmin edici, örnekteki gözlemlerin doğrusal bir fonksiyonuysa doğrusal sayılır. Örnek gözlemleri veriyken, doğrusal bir tahmin edici şu biçimi alır: Burada k i ler sabit değerlerdir. §Örneğin olduğundan örnek ortalaması doğrusal bir tahmin edicidir. Çünkü :
örnek ortalaması hesaplanırken her gözleme, 1/n ye eşit olan aynı k ağırlığı verilmiştir. d...Doğrusal Tahmin Edici…
e. Doğrusal en iyi sapmasız tahmin edici (DEST) §Bir tahmin edici, doğrusalsa sapmasızsa ve gerçek b nin öteki doğrusal sapmasız tahmin edicileriyle karşılaştırıldığında en küçük varyansa sahipse, DEST olur.
f. En küçük ortalama hata kareli (OHK) tahmin edici §Ortalama hata karesi ölçütü, sapmasızlık ve en küçük varyans özelliklerinin bir bileşimidir. Burada OHK, tahmin edicinin, ana kütledeki gerçek parametre b ile olan farkının karelesinin beklenen değeri olarak tanımlanır: §OHK nin, tahmin edicinin varyansıyla sapma karesinin toplamına eşit olduğu gösterilebilir:
f… En küçük ortalama hata kareli (OHK) tahmin edici… İspat:
Çünkü: f. En küçük ortalama hata kareli (OHK) tahmin edici
g. Yeterli tahmin edici §Yeterli bir tahmin edici, gerçek parametre hakkında bir örneğin içerdiği bütün bilgileri kullanıma koyan bir tahmin edicidir. Bu başka hiçbir tahmin edicinin, tahmin edilmekte olan gerçek ana kütle parametresi hakkında daha fazla bilgi sunamayacağı anlamına gelir.
2. Tahmin edicilerin büyük örnek özellikleri: Asimtotik özellikler §Büyük örnek özelliklerinin, bir tahminin iyiliğini belirleme ölçütü olarak kullanılması, örneğin sonsuz büyük olmasını gerektirir. İşte bu nedenle bu özelliklere asimtotik özellikler denir. Örnek büyük olduğu zaman bu özelliklerin yaklaşık olarak sağlandığı varsayılır. Özellikler ise şunlardır: asimtotik sapmazlık, tutarlılık ve asimtotik etkinlik.
Asimtotik dağılım: Bir dizi rassal değişken düşünüldüğünde; Bunlardan her birinin kendi dağılımı, ortalaması ve varyansı vardır. Dağılımlar gitgide artan örnek büyüklüklerinden oluşturulmuştur. n T sonsuza giderken bu dağılımlar da belli bir dağılıma doğru yaklaşıyor olabilirler. İşte bu dağılıma {X (n) } dizisinin asimtotik dağılımı denir Tahmin edicilerin büyük örnek özellikleri: Asimtotik özellikler
a. Asimtotik sapmasızlık… §Bir tahmincinin asimtotik sapması, asimtotik ortalaması ile gerçek parametre arsındaki farka eşittir. §Eğer edicisinin asimtotik ortalaması, ana kütlenin gerçek b parametresine eşit ise, bu tahmin edici, bu parametrenin asimtotik sapmasız tahmin edicisidir.
§Eğer bir tahmin edici (sonlu küçük örneklerde) sapmasızsa aynı zamanda asimtotik sapmasızdır, ama bunun tersi doğru değildir. a… Asimtotik sapmasızlık Asimtotik bir sapmasız tahmin edici, örnek büyüklüğü yeterine büyük olduğunda sapması kaybolan bir tahmin edicidir.
b. Tutarlılık… §Bir edicisi, aşağıdaki iki koşulla, ana kütlenin b gerçek parametresinin tutarlı bir tahmin edicisidir: 1. asimtotik sapmasız olmalıdır. 2. n sonsuza giderken'nin varyansı sıfıra yaklaşmalıdır:
§Eğer varyans sıfırsa, dağılım ana kütlenin gerçek parametresinin üstünde bir noktada toplanır. §Bir tahmin edicinin tutarlı olup olmadığını anlamak için, n arttıkça sapmanın ve varyansının ne olduğuna bakılmalıdır. (n) büyüdükçe hem sapma hem varyans azalmalı ve limitte ( iken) sıfır olmalıdır. Tutarlılık kavramı aşağıda çizilmiştir. Örnek büyüklüğü artıkça hem sapma hem varyans azalmaktadır. Tutarlılık…
c. Asimtotik etkinlik Eğer (1) tutarlıysa (2)Başka herhangi bir tutarlı tahmin ediciye göre daha küçük bir asimtotik varyansı varsa bu tahmin edici ana kütlenin gerçek b parametresinin asimtotik etkin bir tahmincisidir. Eğer; ise asimtotik etkindir. Burada, b nin başka bir tutarlı tahmin edicisidir. Tutarlı tahmin ediciler karşılaştırıldığında hangisinin varyansı daha hızla sıfıra yaklaşıyorsa o, asimtotik etkendir.
3. En Küçük Kareler Tahmin Edicilerinin Özellikleri §Hata terimi u'nun bazı genel varsayımları yerine getirmesi, yani ortalamasının sıfır ve varyansının sabit olması koşuluyla, en küçük kareler tahmincilerinin DES ( doğrusal, en iyi, sapmasız) özelliklerini sağlamasına Gauss-Markow en küçük kareler teoremi denmektedir.
a. Doğrusallık §En küçük kareler tahminleri ve gözlenen örnekteki Y i değerlerinin doğrusal fonksiyonlarıdır. Varsayım gereği X i ler hep aynı değerlerle göründüklerine göre en küçük kareler tahminlerinin yalnız Y değerlerine bağlı olduğu gösterilebilir. İspat: Varsayım gereği X değerleri sabit değerler kümesidir. Bu durumda k i lerde örnekten örneğe değişmezler.
Bu durumda şunu yazabiliriz: Y’lerin doğrusal bir fonksiyonudur. Bağımlı değişken değerlerinin doğrusal bir bileşimidir. ve k i Örnekten örneğe değişmez. katsayı tahmini sadece Y ye bağlıdır. …Doğrusallık
b. Sapmasızlık § ve nin sapmasızlık özelliği ve şeklindedir. Bu özelliğin anlamı, örneklerin sayısı artıkça tahminler de parametrelerin gerçek değerine yaklaşır. Başka bir deyişle, n sayıda Y ve X gözleminden oluşan, olanak içindeki bütün örnekleri seçildiğinde ve ile tahminleri her örnek için hesaplandığında, bu tahminlerden çok fazla sayıda elde edilir. Bunların ortalaması ise ilişkinin parametrelerine eşit olur. Tahminlerin dağılımı, orta nokta olarak parametrenin gerçek b değeri üzerinde toplanacaktır.
c. En Küçük Varyans §Gauss-Markow teoremi ispatı: Bu teoreme göre en küçük kareler tahminleri, başka ekonometri yöntemleriyle bulunmuş herhangi bir başka doğrusal sapmasız tahmin ediciler arasında en iyisidir ( varyansı en küçük olandır). EKK yönteminin tercih edilmesinin temel nedeni de bu özelliktir.
Doç. Dr. A. Talha YALTA- “Bağlanım Çözümlenmesi” slaytından alıntılar mevcuttur.