1 İKTİSAT DOKTORA PROGRAMI MAKROEKONOMİK ZAMAN SERİLERİ DERSİ SUNUSU VERİ SETİ ANALİZİ, EKONOMİK SERİLERİN DURAĞANLIĞI SORUNU VE SAHTE REGRESYON HAZIRLAYANLAR.

Slides:



Advertisements
Benzer bir sunumlar
Uygun Hipotezin Kurulması, Tip I Hata ve Tip II Hata
Advertisements

Bölüm 5 Örneklem ve Örneklem Dağılımları
Kütle varyansı için hipotez testi
GİRİŞ BÖLÜM:1-2 VERİ ANALİZİ YL.
Yrd. Doç. Dr. Mustafa Akkol
ZAMAN SERİLERİ -1 ÖNGÖRÜ :
Prof.Dr.Şaban EREN Yasar Üniversitesi Fen-Edebiyat Fakültesi
İLİŞKİLERİ İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ
İstatistik Tahmin ve Güven aralıkları
Box-Jenkins Yöntemi ile Zaman Serileri Perspektifinden Avro’ya Bakış
BEIER CÜMLE TAMAMLAMA TESTİ
ANOVA.
Diferansiyel Denklemler
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
BEIER CÜMLE TAMAMLAMA TESTİ
EKO308 İKTİSADİ PLANLAMA 1. Hafta: Giriş.
Tanımlayıcı İstatistikler
MATRİSLER ve DETERMİNANTLAR
Merkezi Eğilim (Yığılma) Ölçüleri
İstatistikte Bazı Temel Kavramlar
KOŞULLU ÖNGÖRÜMLEME.
OLASILIK ve OLASILIK DAĞILIMLARI
Koentegrasyon Bir çok makro iktisadi zaman serisi stokastik ya da deterministik trend içermektedir. Bu tür serileri, durağanlığı sağlanıncaya kadar farkını.
Temel İstatistik Terimler
Değişkenlik Ölçüleri.
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
Yard. Doç. Dr. Mustafa Akkol
SÜREKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK YOĞUNLUK FONKSİYONLARI
OLASILIK ve KURAMSAL DAĞILIMLAR
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
TANIMLAYICI İSTATİSTİKLER
DENEY TASARIMI VE ANALİZİ (DESIGN AND ANALYSIS OF EXPERIMENTS)
PORTFÖY OPTİMİZASYONU
ÇOK DEĞİŞKENLİ FONKSİYONLARDA
Eğer bir X t zaman serisi, E(X t ), ve X t ile X t+s arasındaki anakitle kovaryansı t’den bağımsız ise durağandır. 1 DURAĞAN SÜREÇ.
ÖNGÖRÜMLEME (Forecasting)
PİYASA İÇİN EKONOMETRİ: Vadeli İşlemler Piyasası Uygulaması
Diferansiyel Denklemler
GÖRÜNÜRDE İLİŞKİSİZ REGRESYON MODELLERİ
Normal Dağılımlılık EKK tahmincilerinin ihtimal dağılımları u i ’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.  tahminleri için uygulanan.
EŞANLI DENKLEMLİ MODELLER. Eşanlı denklem sisteminde, Y den X e ve X den Y ye karşılıklı iki yönlü etki vardır. Y ile X arasındaki karşılıklı ilişki nedeniyle.
MEVSİMSELLİKTEN ARINDIRMA
DOĞRUSAL OLMAYAN REGRESYON MODELLERİ…
Ölçme Sonuçlarının Değerlendirilmesi
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
Otokorelasyon ut = r ut-1 + et -1 < r < +1 Yt = a + bXt + ut 
Tüketim Gelir
DEĞİŞKENLİK ÖLÇÜLERİ.
Normal Dağılım EKK tahmincilerinin ihtimal dağılımları u i ’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.  tahminleri için uygulanan testlerin.
Normal Dağılımlılık EKK tahmincilerinin ihtimal dağılımları u i ’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.  tahminleri için uygulanan.
ÖNGÖRÜMLEME (Forecasting)
…ÇOKLU REGRESYON MODELİ…
Asimetri ve Basıklık Ölçüleri
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
ÖĞRENME AMAÇLARI İki değişken arasındaki “ilişki” ile neyin kastedildiğini öğrenmek Farklı yapıdaki ilişkileri incelemek Ki-kare analizinin uygulandığı.
Asimetri ve Basıklık Ölçüleri
HİPOTEZ TESTLERİNE GİRİŞ
Maliye’de SPSS Uygulamaları
Bölüm 7 Coklu regresyon.
OLASILIK ve İSTATİSTİK
Türkiye’de Okun yasasının Geçerliliğinin İncelenmesi: Ekonometrik Bir Analiz Adnan Menderes Üniversitesi Betül Ünal Doç. Dr. Mehmet Mercan.
VERİLERİN DÜZENLENMESİ VE ORGANİZASYONU
TEMEL BETİMLEYİCİ İSTATİSTİKLER
ÜSTEL DÜZLEŞTİRME YÖNTEMİ
DEĞİŞKENLİK ÖLÇÜLERİ.
Temel İstatistik Terimler
Temel İstatistik Terimler
Normal Dağılımlılık EKK tahmincilerinin ihtimal dağılımları ui’nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır. b tahminleri için uygulanan testlerin.
Sunum transkripti:

1 İKTİSAT DOKTORA PROGRAMI MAKROEKONOMİK ZAMAN SERİLERİ DERSİ SUNUSU VERİ SETİ ANALİZİ, EKONOMİK SERİLERİN DURAĞANLIĞI SORUNU VE SAHTE REGRESYON HAZIRLAYANLAR AYDIN ARI & AYLİN ABUK DUYGULU

2 SUNU PLANI •Zaman serilerine giriş •Temel kavramlar •Grafik gösterim •İstatistiksel özellikler •Trend, konjonktür dalgası ve mevsimsellik •Dönüştürme ve düzleştirme •Veri madenciliği •Sahte regresyon sorunu •Durağanlık sorunu •Otokorelasyon ve ARIMA

3 ZAMAN SERİLERİNE GİRİŞ •Zaman serilerinin ampirik analizinin iktisatta önemli bir yeri vardır. •Ekonometrik analizin tarihsel akışı içinde iktisatçılar, bir yandan bir seriyi trend, konjonktür dalgası (business cycle), mevsimsel değişkenlik ve düzensiz (geçici) etkiler gibi gözlemlenemeyen bileşenlerine ayırmakla ilgilenmiş, öte yandan öngörümleme üzerinde yoğunlaşmışlardı. •Bu iki çalışma alanı arasındaki dikotomi, Box ve Jenkins’in 1970 tarihli ünlü kitaplarında geliştirmiş oldukları ARIMA süreci ile giderildi. Buna göre bir serinin ARIMA özelliklerini bilmek, daha iyi bir öngörümlemenin önkoşuludur.

4 •Öte yandan büyük ölçekli makroekonometrik modeller de, öngörümleme ve politika simülasyonları için kullanılmaktaydı. Box-Jenkins yöntemi, bu modellerin geçerliliği sorununu gündeme getirdi. Buna karşın, büyük ölçekli makro modelleme taraftarları, tek değişkenli zaman serisi modellerinin politika değerlendirmeleri için uygun olmadığını öne sürdüler. •Bu tartışmalar sürerken Lucas (1976), makro modellerin de aynı sorunları taşıdığını öne sürerek, ekonometrik analize önemli bir katkıda bulundu. •Granger ve Newbold (1974) ise, sahte regresyon sorununu gündeme getirerek, ekonometri teorisindeki bugünkü gelişmelerin önünü açtı.

5 Zaman serisi verilerinin özelliklerinin incelenmesi (exploratory data analysis) yoluyla, şunlar elde edilebilir (Mills, 1990: 5): - Daha iyi modelleme - Daha etkin hesaplama - Eldeki veriler, kullanılan modelleme teknikleri ve ilgili iktisat teorisi arasındaki ilişkilerin daha iyi anlaşılması.

6 TEMEL KAVRAMLAR 1. Stokastik süreçler Teorik olarak bir zaman serisi, bir rassal değişkene {X t } ilişkin gözlemler bütünüdür. Zamana göre sıralanmış böyle bir gözlemler serisi, stokastik süreç olarak adlandırılır. Değişkenler, sürekli ya da kesikli olabilir ve sırasıyla X(t) ve X t olarak gösterilir. İktisadî zaman serileri, kesikli değişkenlerdir. X t gibi kesikli veya sürekli bir rassal değişkenin alabileceği değerlerin hangi sıklıkta olduğunu ifade eden fonksiyona olasılık sıklık fonksiyonu (probability density function) denir ve f(x) ile gösterilir. Bu fonksiyon 0 ile 1 arasında bir değer alır (Uygur,2001:).

7 X t rassal değişkeninin en küçük değerinden belli bir değerine kadar olan sıklıkları yani olasılıkların toplamını ise dağılım fonksiyonu (distribution function) verir. Stokastik bir sürecin dağılımı, söz konusu değişkenin 1. ve 2. momentleri ile nitelendirilebilir. Her ikisi de zamanın (t) bir fonksiyonudur. 1. moment, ortalamadır :  t =E(X t ) 2. moment, varyanstır :  t 2 =Var(X t ) ve otokovaryans :  t1,t2 =Cov(X t1 X t2 )‏ Eğer X t normal bir dağılıma sahipse, X t ‘nin dağılımı 1. ve 2. momentleri tarafından tam olarak ifade edilebilir ve bu durumda, Gaussian süreç olduğundan söz edilir (Maddala&Kim, 1998: 9).

8 Momentlerin zamana bağımlı olması, önemli bir sorundur. Buna ek olarak, tahmin edilmesi gereken çok sayıda parametre vardır. Tahmin edilmesi gereken parametre sayısını azaltabilmek için iki tür kısıta başvurulabilir: i. Durağanlık (Sürecin zamana bağımlılığı hakkındaki kısıtlamadır)‏ ii. Asimptotik bağımsızlık (Sürecin hafızası (memory) hakkındaki kısıtlamadır)‏

9 Durağanlık momentler aracılığıyla şöyle tanımlanabilir: Ortalaması ve varyansı zaman içinde değişmeyen ve iki dönem arasındaki kovaryansı, bu kovaryansın(otokovaryans) hesaplandığı döneme değil de yalnızca iki dönem arasındaki uzaklığa bağlı olan süreç durağan süreçtir.

10 2. Hareketli ortalamalar süreci (MA)‏ {  t } ortalaması sıfır ve varyansı sabit (  2 ) olan rassal bir süreç olsun. {X t } süreci şu şekilde tanımlanıyorsa; X t =  0  t +  1  t  q  t-q q’uncu dereceden hareketli ortalama süreci olarak adlandırılır ve MA(q) olarak gösterilir. MA süreci ekonometride çoğunlukla trendden arındırma yöntemleriyle kullanılmaktadır. Trendden arındırma için sıkça kullanılan bir yöntem X t zaman serisinin gerektiği kadar farkını almaktır.

11 Eğer X t şöyle ise X t =  0 +  1 t +  2 t 2 +  t X t ’nin gerektiği kadar farkını alırsak, trendden arındırmış oluruz fakat bu durumda  t, MA sürecine sahip olur. Böylece trendden arındırılmış seri, orijinal serinin aksine dalgalanma gösterir. Bu sahte dalgalanma olgusu Slutsky etkisi olarak adlandırılır(Maddala&Kim,1998).

12 3. Otoregresif süreç (AR)‏ {  t } ortalaması sıfır ve varyansı  2 olan rassal bir süreç olsun. {X t } süreci şu şekilde tanımlanıyorsa; X t =  1 X t-1 +  2 X t  p X t-p +  t p’inci dereceden otoregresif süreç olarak adlandırılır ve AR(p) olarak gösterilir.

13 4. ARMA süreci Adından da anlaşıldığı üzere AR ve MA özelliklerine aynı anda sahip olan bir süreçtir. ARMA (p,q) modeli şöyle gösterilebilir: X t =  1 X t-1 +  2 X t  p X t-p +  t +  1  t  q  t-q

14 5. Box-Jenkins yöntemi Zaman serisi analizinde yaygın olarak kullanılan yöntemlerden birisidir. Bu yöntemin temeli, ARIMA (p,d,q) paradigmasına dayanır. Yöntemin yaygın kabul görmesinin nedeni, genelliğidir; durağan olan ya da olmayan, mevsimsel öge içeren ya da içermeyen herhangi bir zaman serisini modellemeye olanak tanır ve ekonometrik paket programlarıyla kolaylıkla uygulanabilir.

15 Yöntem beş basamaktan oluşur (Maddala&Kim, 1998:18): i) Durağanlığı sağlamak için fark alma Bir serinin korelogram grafiğine bakılarak durağan olup olmadığı saptanabilir. Durağan bir serinin korelogramı, gecikme sayısı (  ) arttıkça hızlı bir azalma gösterir. Durağan olmayan zaman serilerinde ise azalma çok yavaştır.

16 ii) Başlangıç modelinin belirlenmesi Korelogramın incelenmesi ile, AR ya da MA bileşenlerinin dereceleri konusunda karar verilebilir. Bir MA sürecinin korelogramı, belli bir noktadan sonra sıfırdır; AR sürecininki ise geometrik olarak azalır. ARMA süreçlerinin korelogramları ise değişik görünümlerdedir. Bu yolla, başlangıç ARMA modeli hakkında bir ön fikir sahibi olunabilir.

17 iii) Modelin tahmini İkinci aşamadaki başlangıç ARMA modeli, bu aşamada tahmin edilir. AR modellerinin tahmini EKK ile yapılır ve hata kareler toplamını minimum yapan p düzeyi seçilir. MA modellerinin tahmininde ise hata kareler toplamı, değişkenin gözlemlenen değerlerinin ve modeldeki parametrelerin bir fonksiyonu olarak yazılamaz. Bunun yerine, hata terimlerinin kovaryans matrisi yazılır ve modeller, normal dağıldıkları varsayılarak, maksimum olabilirlik (ML) yöntemi ile tahmin edilir. ARMA modelleri de yine ML yöntemi ile tahmin edilir.

18 iv) Diyagnostik kontrol Bir zaman serisinin AR, MA ya da ARMA modeli tahmin edildikten sonra, modelin doğruluğu kontrol edilmektedir. Bu amaçla kullanılan en önemli iki kriter; Akaike bilgi kriteri (AIC) ve Schwartz Bayesian bilgi kriteridir (BIC). p tahmin edilecek parametre sayısı ve n gözlem adedi iken; AIC (p)= n log  2 +2p ve BIC (p)=n log  2 + p log(n)‏ şeklinde elde edilir. Hata kareler toplamı, RSS=  2 t iken  2 = RSS/(n-p). Sonuçta, en düşük AIC veya BIC değerini veren model seçilir.

19 Ayrıca hata terimlerinin içsel bağıntıl (otokorelasyon) olup olmadıkları da araştırılır. Box ve Pierce (1970), sadece birinci sıra değil, tüm sıralardan hata terimlerinin içsel bağıntılarına bakılması gerektiğini öne sürmektedirler. Bu amaçla önerdikleri Q istatistiği; Q= Model tahmini doğru ise Q, asimtotik olarak  2 (m-p-q) gibi dağılmıştır. m, otokorelasyonun sırasını gösterir. Q istatistiği yaygın olarak kullanılmakla birlikte, otoregresif modellerde (ya da gecikmeli bağımlı değişken içeren modellerde) uygun değildir çünkü içsel bağıntılı hata terimlerinin varlığı EKK tahmin edicisini tutarsız kılmaktadır. Bunun yerine Lagrange çarpanı (LM) test istatistiği önerilmektedir.

20 v) Öngörü Bir zaman serisinin ARMA süreci modellendikten sonra, öngörüsü kolaylıkla yapılabilir.

21 GRAFİK GÖSTERİM •Serileri grafiksel olarak yorumlamak, çoğu zaman tabloları yorumlamaktan daha kolaydır. Bu nedenle, zaman serisi analizinin ilk aşamasını grafik inceleme oluşturmaktadır. •Grafik incelemede iki tür grafik yaygın olarak kullanılmaktadır: a) Bir ya da daha çok serinin zamana karşı grafiği (time series plots)‏ b) İki ya da daha çok serinin birbirlerine karşı grafiği (scatter plots)‏

22 •Zaman serisi grafiği bir bakışta, bir ya da daha çok serinin en temel özelliklerini örneğin; trend, konjonktür dalgaları, yapısal değişmeler ya da kırılmalar ve mevsimsel değişmeler gibi, görmemize olanak sağlar. Hatta bazı serilerin grafikleri, o serilerin istatistiksel özellikleri hakkında da ön bilgi verebilir. Örneğin, serinin iki alt döneme ilişkin ortalamalarının farklı olduğunu ya da seride büyük bir oynaklık (volatility) olduğunu görebiliriz. Bu anlamda, grafiklerini inceleyerek serilerin durağanlığı hakkında da bir ön fikir sahibi olabiliriz.

23 •İki ya da daha çok serinin serpilme grafiğini incelemek de önemli bilgiler verebilir. •İkiden daha çok serinin serpilme grafikleri için de serpilme grafiği matrisi (scatterplot matrix) gibi yöntemler vardır. Bu tür grafikler üç temel özelliğe sahiptir(Johnston&DiNardo,1997:3): i) Değişkenlerin birlikteliğinin ya da birlikte değişmesinin yönünü (yani pozitif ya da negatif olarak birlikte hareket edip etmediklerini) gösterir. ii) Bu birlikteliğin gücünü gösterir. iii) Bu birlikteliğin doğrusal olup olmadığını gösterir.

24

25

26 İSTATİSTİKSEL ÖZELLİKLER •Bir dağılımı diğerinden ayırt etmemizi sağlayan başlıca unsurlar dağılımın toplanma noktaları ve bu noktalar etrafında birimlerin ne ölçüde yayılmış olduklarıdır. Dağılımın toplanma noktaları ya da merkezi eğilimi, merkezi eğilim ölçüleri ile, bu eğilim ölçüleri etrafındaki yayılma derecesi ise dağılma ya da yayılma ölçüleri ile saptanır (Korum, 1991). •En yaygın kullanılan merkezi eğilim ölçüleri, aritmetik, geometrik ve harmonik ortalamalar ile mod ve medyandır. •Yayılma ölçüleri ise standart sapma ve varyanstır.

27 •Bunlar dışında, bir dağılımı niteleyen iki ayrı parametre de ekonometrik çalışmalarda sıklıkla kullanılmaktadır. Bunlardan, dağılımın ortalama değere göre simetrikliğinin derecesini gösteren ölçüt, çarpıklık (skewness) ölçütüdür ve beklenen değere göre üçüncü momentdir;  3 ile gösterilir.  3 =0 ise rassal değişkenin dağılımı simetriktir.  3  0 ise dağılım sağa çarpık,  3  o ise sola çarpıktır (Uygur, 2001). •Bir diğer parametre ise rassal değişkenin dağılımının sivriliğini ya da basıklığını gösteren basıklık (kurtosis) ölçütüdür, beklenen değere göre 4. Momenttir.

28 •Momentler, herhangi bir olasılık ya da sıklık fonksiyonunun başlangıç noktası etrafındaki dağılımı verilen rassal değişkenin kuvvetlerinin beklenen değerleridir. •Ekonometrik çalışmalarda en önemli nokta, değişkenlerin, özellikle de hata terimlerinin normal dağılıma sahip olup olmadıklarının saptanmasıdır.  2, F ve t dağılımları normal dağılımdan türetildiği için bunlara ait istatistikleri kullanan hipotez testlerinin geçerliliği ve güvenilirliği için ilgili değişkenin normal dağılıma sahip olması gereklidir.

29 •Herhangi bir zaman serisi analizinde, hata terimlerinin normal dağılmış olmaları bu açıdan önemlidir. Hata terimlerinin normal dağılıma sahip olup olmadıklarını saptamak üzere Jarque- Bera’nın önerdiği Wald testi kullanılır. Bu testte çarpıklık ve basıklık katsayıları yer almaktadır. Ekonometrik programlar kullanılarak hesaplanan test istatistiği,  2 tablosundan elde edilen kritik değerden büyükse ya da olasılık (prob.) değeri % 5’den küçükse, H o :normal dağılım hipotezi reddedilir ve normal dağılıma sahip olmadığına karar verilir.

30 TREND, KONJONKTÜR DALGASI VE MEVSİMSELLİK Herhangi bir zaman serisinin bileşenleri şu şekilde ayrıştırılabilir: y t = g t + c t + s t + u t g t, trend ya da büyüme bileşeni; c t, çevrimsel ya da konjonktür bileşeni; s t, mevsimsel bileşen; u t, düzensiz bileşendir.

31 Değişik yöntemlerle mevsimsel uyarlanmış bir zaman serisi yine değişik trendden arındırma (detrending) ve düzleştirme (smoothing) teknikleri ile trend ve konjonktür bileşenlerine ayrıştırılabilirler. Genelde kullanılan teknikler: i) İki taraflı hareketli ortalamalar uygulaması, ii) Birinci farkın alınması, iii) Doğrusal ya da kuadratik zaman trendi kullanılması, iv) Hodrick-Prescott filtre uygulaması.

32 Zaman serisi analizinde, orijinal serinin bileşenlerine ayrıştırılması için farklı çekip çıkarma yöntemleri vardır. x t =  +  t + u t biçimindeki trend durağan modeller, zamana (ya da zaman polinomuna) göre regresyonu yapılarak zaman serisini "trendden arındırma"nın en yaygın tekniğidirler; buradaki hata terimleri ise konjonktür (business cycle) teorisi tarafından açıklanan çevrimsel bileşeni oluşturmaktadırlar (Mills,1990: s.200). Nelson ve Plosser (1982: s.140), bu biçimdeki zaman trendi regresyonundan elde edilen hata terimlerini, iş çevrimi analizi için uygun veri kümesi olarak kabul etmektedirler.

33 İncelediğimiz zaman serisi gerçekte, fark durağan süreç izliyorsa, trend durağan süreç sınıfından bir seri kullanmanın bazı istenmeyen sonuçları olacaktır. Eğer bir zaman serisi fark durağan (difference stationary, DS) süreçler sınıfındansa, trendi ya da seküler (uzun süreli) büyüme bileşeni de DS sınıfından olacaktır (bkz. Mills,1990: s.201). Eğer bileşenler deterministik değilse, deterministik formülasyon bazı işlemlerle stokastik forma dönüştürülür. Bu yaklaşımlardan birisi, bu gözlemlenemeyen bileşenlerin doğrudan yorumunu mümkün kılan yapısal zaman serisi modelleri ya da gözlemlenemeyen bileşen (GB) modelleridir (Özcan, 1994: s1).

34 Yapısal modeller, gözlemlenemeyen ARIMA modellerin toplamı olarak düşünülebilir. Başka bir yaklaşım olan Hodrick-Prescott Filtrede, trendin stokastik olduğu varsayılmıştır. Fakat zaman içinde göreli olarak pürüzsüz hareket eder ve bileşenler bağımsızdır (Hodrick&Prescott, 1997).

35 VERİLERİN DÖNÜŞTÜRÜLMESİ VE DÜZLEŞTİRİLMESİ •Zaman serisi analizinde çoğu kez, verilerin gözlemlenen değerleri yerine dönüştürülmüş değerleri ile çalışmak kolaylık sağlamaktadır. Tek değişkenli analiz yapmak üzere bir zaman serisini dönüştürmek ile çok değişkenli analizde kullanılan iki ya da daha fazla zaman serisini dönüştürme işlemleri arasında bir ayrım yapılmalıdır.

36 Zaman serilerinin incelenmesinde temel amaç “büyük ölçekli” ya da uzun dönemli davranışı saptamak olduğundan bu “düzleştirme” adı verilen ve veri değerlerinin ayrıştırılmasını içeren bir işlemle gerçekleştirilir. Bu ayrıştırma ile zaman serisinin ardında yatan temel süreçleri daha açık ve net görmek mümkün olmaktadır. Örneğin AR(2) sürecini alalım; y t =  1 y t-1 +  2 y t-2 +  t ^y t = ^  1 y t-1 + ^  2 y t-2 y t = ^y t + ^  t olarak yazılabilir.

37 Başka bir deyişle y t serisi, Data= fit+hata terimi olmaktadır. Verileri bu şekilde ayrıştırma işlemi, bir seriyi düzleştirme işleminden daha fazlasını ifade ettiğinden şu formülasyon daha uygun olacaktır (Mills, 1990: 54-5): Data=smooth+rough Bir çok düzleştirme yöntemi bulunmaktadır. Bunlardan birisini örnek verelim:

38 Hareketli medyanlar (running medians): En basit hareketli medyan, 3. sıradan olandır; zaman serisinin her bir değerini, bu değerin kendisi, önceki ve sonraki değerlerden oluşan kümenin medyanı ile değiştirir. Böylece komşularıyla ilişkisi açısından daha uçta yer alan değer bir anlamda dışlanmış olmaktadır. Uygulamada daha yüksek dereceden hareketli medyanlar kullanılır (Mills, 1990: 55). Bunun dışında Hanning, resmoothing ve reroughing, smoothing endpoints ve splitting gibi teknikler de vardır.

39 Dönüştürme: Tek bir zaman serisini dönüştürmenin iki nedeni vardır. i) Dağılımsal olarak simetri ve muhtemelen normalliği sağlamak ve ii) serinin lokasyon ve değişkenliğini stabilize ederek zaman içinde meydana gelen eş değişkenliğini azaltmak. İkinci nedene durağanlığı sağlamak da denilebilir. Zaman serileri arasındaki ilişkiyi dönüştürmenin amacı genellikle serileri doğrusal kılmaktır. Böylece doğrusal regresyon analizleri yapılabilir.

40 VERİ MADENCİLİĞİ (DATA MINING)‏ Veri madenciliği genel olarak deneme yanılma yoluyla en iyi modelin araştırılması yönteminde, deneyleri kontrol etme güçlüğü bulunması sorununa işaret etmektedir. Bir modeli nihai olarak tanımlayabilmek üzere veri bir gözlem kümesi kullanarak ardışık işlemler yapılması anlamındadır. “İyi” bir modelin, yüksek bir belirlilik katsayısına (R2), “anlamlı” t- istatistiklerine ve 2 civarında bir DW istatistiğine sahip olduğunu kabul edelim.

41 Elimizdeki çok sayıdaki aday değişkeni, değişik regresyonlar aracılığıyla modellemeye çalışmak ve “en iyi” regresyona, R 2, t ve DW istatistiklerine bakarak karar vermek pratikte en çok rastlanılan veri madenciliği biçimidir. Özetle, bu şekilde standart diyagnostik istatistikleri kullanarak model seçimi yapma işlemine veri madenciliği (data mining) denmektedir ve 70’lerde yapılmış çalışmaların çoğu bu türdendir. Bu çalışmalarda, aynı iktisadî modeli tahmin etmek üzere, çok sayıda farklı değişken ile çok sayıda regresyon yapıp, bunların sonuçlarını rapor etmek ve bunlar arasından “en iyi” modeli diyagnostik istatistiklere ve “tahminin iyiliği” (goodness of fit) ölçütlerine dayanarak ortaya koymaktır.

42 Burada önemli bir noktayı belirtmek gereklidir: Farklı modellere ait R 2 değerleri tümüyle farklı dağılım fonksiyonlarına sahip olabileceklerinden, karşılaştırma amacıyla kullanılamazlar. Ayrıca veri madenciliğinde asıl önemli sorun, R 2 ve t istatistiklerine dayanarak, durağanlık olgusunu dikkate almadan, aslında zayıf modellerin seçilmesi durumunda ortaya çıkmaktadır. Bu nedenle sorulması gereken en önemli soru, iktisadî ilişkilerin modellenmesinde veri madenciliğinin yapılıp yapılmaması değil, nasıl yapılması gerektiğidir. Veri madenciliğinin nasıl yapılacağı sorusunun yanıtı, son derece kapsamlıdır ve bu dersin geri kalan sunularının konusunu oluşturacaktır.

43 SAHTE REGRESYON SORUNU •Sahte regresyon sorununa ve durağanlığa ilişkin temel açıklamalara geçmeden rassal yürüyüş, birim kök ve beyaz gürültülü hata terimi kavramlarını açıklamak gereklidir. y t gibi rassal bir değişkene ait süreç : y t =  +  y t-1 +u t denklemi ile gösterilsin.  =1 ise AR(1) sürecinin birim köke sahip olduğu ifade edilir. Bu durumda denklem şu şekilde yazılabilir: y t =  +y t-1 +u t

44 •Bu haliyle, söz konusu rassal değişkene ilişkin süreç kaymalı rassal süreç (random walk with drift) olarak adlandırılır. •Denklemin sabit teriminin olmaması durumu (  =0) ise kaymasız rassal süreç (simple random walk) şeklinde ifade edilir. •Örneğin; A t = A t-1 +u t AR(1) durağan (  <1)‏ R t =0.05+R t-1 +u t Kaymalı rassal süreç (  =1) S t =S t-1 +u t Kaymasız rassal süreç (  =0 ve  =1)‏ E t = E t-1 +u t Patlayan (explosive) süreç (  >1)‏ •Gujarati (1999) yukarıdaki açıklamaları şöyle özetlemiştir: “Birim kökü olan zaman serisi, rassal yürüyüşe sahiptir.”

45 •Beyaz gürültülü (white noise) hata terimi ise ortalaması sıfır,varyansı sabit ve birbirinden bağımsız normal dağılmış bir zaman serisidir. Bu ifade şu şekilde gösterilebilir: E(u i )=0 E(u i 2 )=  2 E(u i,u j )=0 i  j •Bu kavramlar yardımıyla sahte regresyon sorununa ilişkin şunlar söylenebilir: Bu olguyu ele ilk alan Granger ve Newbold (1974) yaptıkları çalışmalarında, ekonometrisyenlerin ilgilendikleri değişkenlerin zaman serisi özelliklerini göz ardı etmemelerini, bir çok iktisadî değişkenin rassal yürüyüş ya da bütünleşik (integrated) süreç özelliği gösterdiğini dikkate almaları gerektiğini belirtmektedir.

46 Çünkü aksi durumda, elde edilen yüksek R 2 ya da düzeltilmiş R 2 ile düşük DW istatistiğinin birlikte görüldüğü sonuçlarla sıkça karşılaşılır. Böyle bir durumda, elde edilen sonuçların ekonomik bir anlamı yoktur. Granger&Newbold (1974), elde edilen sonuçların tümüyle sahte olduğunu öne sürmüşlerdir. Başka bir deyişle bağımlı değişken ile açıklayıcı değişkenler arasında koentegrasyon yoksa, regresyon “sahte”dir. Bu kavramı ortaya atan Granger &Newbold (1974), sahte regresyonu saptamak üzere bir başparmak kuralı belirtirler. Buna göre bir regresyonda R 2 >DW ise sahte regresyon şüphesi oldukça kuvvetlidir. Campbell ve Perron (1991:177), DW istatistiğinin Engle ve Granger’in (1987) önerdiği gibi koentegrasyonun olup olmadığının testinde kullanılmaması gerektiğini belirtirler.

47 Regresyon analizinde, içsel bağıntılı hata terimlerinin varlığı üç önemli sonuç ortaya çıkarmaktadır: i) Regresyon katsayılarının tahminleri etkin değildir. ii) Regresyon denklemlerine dayalı öngörüler optimal değildir. iii) Katsayılara ilişkin anlamlılık testleri geçersizdir. Granger &Newbold (1974), ilk ikisinin diğer ekonometrisyenler tarafından açıkça ortaya konduğunu belirterek, üçüncü noktayı incelemekte ve sahte regresyon olgusunu ortaya koymaktadır.

48 DURAĞANLIK •Ekonomik zaman serilerinde “birim kök” bulunduğunda bazı güçlükler ortaya çıkar. Birim köke sahip değişkenleri içeren regresyonlara, standart asimptotik dağılım teorisi uygulanamaz; sorun gözardı edilerek yapılacak çıkarsamalar (inference) yanlış olacaktır. Buna karşın bazı birim kök regresyonlarında, katsayı tahminleri gerçek parametre değerlerine, standart durağan serilerin regresyonundan daha hızlı yakınsamaktadırlar. Büyük örneklerde, bu özelliğe sahip katsayılar bir çok yanlış nitelemeye karşı sağlamdırlar (robust). Öte yandan, bu tür tahminler küçük örneklerde zayıf tahminler vermektedir (Campbell&Perron,1991:141).

49 •Ortalamasıyla varyansı zaman içinde değişmeyen, iki dönem arasındaki ortak varyansı (kovaryans), bu ortak varyansın hesaplandığı döneme değil de, yalnızca iki dönem arasındaki uzaklığa bağlı olan olasılıklı süreç durağan süreç olarak adlandırılır. •Bir zaman serisi değişkeninin kendi gecikmeli veya gelecekteki değerleriyle doğrusal ilişkisini gösteren kovaryansa otokovaryans denir ve s dönem gecikme veya gelecek için Cov(y t,y t-s )=Cov(y t,y t+s )=  s şeklinde gösterilir.  s = E[(y t -  )(y t-s -  )]

50 Formel olarak eğer y t gibi bir zaman serisi değişkeninin i) Beklenen değeri E(y t ) zamandan bağımsız ise, ii) Varyansı Var(y t ) sabit yani zamandan bağımsız ise, iii) Otokovaryansı Cov(y t,y t-s ) da zamandan bağımsız ise, y t değişkenine zayıf (weakly) durağan veya varyans-kovaryans durağan değişken denir.

51 y t =  +  y t-1 +u t (u t beyaz gürültülü varsayılsın). /  /<1 iken y t serisi sabit bir ortalamaya ve varyansa sahiptir. Ayrıca otokovaryansı da zamandan (t) bağımsız, sadece gecikme sayısına bağlı olur, dolayısıyla durağandır (Kanıt için bkz. Örneğin Johston&Dinardo).  =1 iken yukarıdaki AR(1) sürecinin birim köke sahip olduğu söylenir ve denklem y t =  +y t-1 +u t haline gelir. Bu durumda y t ’nin beklenen değeri ve varyansı, zamana bağlı olarak değişmektedir(kanıt için herhangi bir ekonometri kitabına bakılabilir). Dolayısıyla birim kök içeren serilerin durağan olmadığı söylenebilir ve asimptotik teori uygulanamaz.

52 Yukarıdaki AR(1) süreci, EKK ile tahmin edilip birim kök için test yapmak kolaymış gibi görünebilir. H 0 :  =1 H 1 :  1 Burada t istatistiği hesaplanır ve t dağılımının kritik değerleri ile karşılaştırılabilir. Ancak ne yazık ki bu prosedür geçerli değildir, çünkü H 0 altında y t serisi asimptotik bile olsa, testin türetilmesinde varsayılan şartlara uymaz. Test istatistiğinin dağılımı standart değildir ve kritik değerler yalnızca Monte Carlo simülasyonlarından elde edilebilir.

53 Bir zaman serisinin durağan olup olmadığının anlaşılması için i) Grafiğine ve korelogramına bakılabilir, ii) Birim kök testleri yapılabilir. Literatürde durağan olmayan zaman serisine bütünleşik (integrated) denir. Bütünleşme (entegrasyon) derecesi ise, durağan bir seri elde etmek üzere serinin kaç kez farkının alınması gerektiğini ifade eder. 1. Sıradan bütünleşik seri I(1) olarak gösterilir. Durağan seri I(0)’ dır. Genel gösterim I(d) şeklindedir. Bir zaman serisi, zaman içinde tümüyle stokastik ya da rassal şokların etkisiyle yavaşça artma ya da azalma, kayma eğilimi gösteriyor olabilir (örneğin rassal yürüyüşte olduğu gibi).

54 Bu durumda uzun dönemde rassal süreç, ortalamasından uzaklaşma eğilimindedir. Böyle bir eğilime sahip seriye stokastik trende sahip zaman serisi denir. Örneğin y t =  +y t-1 +u t Durağan olmayan stokastik bir sürecin, ortalaması da zamanın bir fonksiyonu olabilir. Bu durumda da deterministik trendden söz edilir. y t =  t +  t  t =  +  t ise y t =  +  t+  t olur. Karma süreç ise y t =  +  t+y t-1 +  t şeklindedir.

55 Rassal yürüyüş süreci stokastik trend ile karıştırılmamalıdır (Charemza&Deadman,1997:90). Rassal yürüyüş aslında, stokastik trendin özel bir durumudur. y t =y t-1 +  t modelinde  t, özdeş ve bağımsız dağılmıştır (identically and independently distributed-iid). Stokastik bir trend için  t (durağan olmak şartıyla) bağımsız dağılmak zorunda değildir. Yani otokorelasyona sahip olabilir. Stokastik trende şu örnek verilebilir: y t =y t-1 +  t,  t =  t-1 +  t |  |<1 ve  t özdeş ve bağımsız dağılmıştır (iid).

56 Durağan olmayan bir zaman serisi, farkı alınarak durağan hale getiriliyorsa fark durağan (difference stationary process) süreç olarak adlandırılmaktadır. Durağan olmayan bir seri, eğer D kere s-farkı alındıktan sonra d kere de 1. farkı alınarak durağan hale geliyorsa (d,D) sıradan mevsimsel entegre olduğu söylenir ve SI s (d,D) ile gösterilir. Örneğin s=4 iken  4 =X t -X t-4 ‘ tür. (Charemza&Deadman, 1997:98).

57 y t ve x t gibi iki I(d) değişken arasındaki regresyonun sahte olup olmaması, bu serilerin içerdiği trend tipine (deterministik ya da stokastik) bağlıdır (Maddala&Kim,1998:32): y t ve x t koentegre değilse, sahte regresyon Sahte regresyon Stokastik Sahte regresyon Regresyon geçerli Deterministik StokastikDeterministik x t y t

58 OTOKORELASYON VE ARIMA •Otokorelasyon (içsel bağıntı) sorunu, genellikle zaman serisi verileri ile tahmin yapıldığında ortaya çıkmaktadır. Otokorelasyon, hata terimleri arasındaki ilişkiyi ifade eder. Yani hata terimleri arasındaki kovaryansın sıfırdan farklı olmasıdır. Ekonometrik bir denklemde, otokorelasyon sorununun var olması, aşağıdaki nedenlere bağlanabilir: i) Zaman serileriyle, özellikle trend içeren zaman serileriyle tahmin yapılması

59 ii) Denklemde bulunması gerektiği halde bulunmayan açıklayıcı değişkenlerin varlığı (özellikle bu değişkenlerden en az birinin otokorelasyona sahip olması)‏ iii) Denklemin matematiksel biçiminin yanlış belirlenmesi iv) Bağımlı değişkende sistematik, yani rassal olmayan ölçme hatalarının bulunması v) Yapısal değişikliğin varlığı

60 d kere farkı alındığında durağan hale gelen seriye I(d) dendiğini biliyoruz. Yani  d x t serisi durağansa fark durağan süreç (DSP) denir. ARMA(p,q) olarak gösterilebilen  d x t serisine ise ARIMA (Autoregressive Integrated Moving Average) süreç denir ve ARIMA(p,d,q) ile gösterilir.

61 KAYNAKÇA Banerjee, A. & J.J. Dolado & J.W. Galbraith & D.F. Hendry (1993), Co-Integration, Error Correction and the Econometric Analysis of Non-Stationary Data, Oxford University Press. Campbell, J.Y.&P. Perron (1991),“Pitfalls and Opportunities: What Macroeconomists Should Know about Unit Roots”, paper presented at the NBER Macroeconomics Conference, Cambridge,MA,March 8-9. Charemza, W.W. and D.F. Deadman (1992), New Directions in Econometric Practice, Edward Elgar, Aldershot, England. Enders, Walter (1995), Applied Econometric Time Series, John Wiley and Sons, USA. Granger, C.W.J.&P.Newbold (1974), “Spurious Regressions in Econometrics”, Journal of Econometrics, No. 2, pp

62 Hodrick, Robert J. & Edward C. Prescott (1997), "Postwar U.S. Business Cycles: An Empirical Investigation", Journal of Money, Credit, and Banking, vol. 29, no. 1 (February), pp Johnston, J.& J.DiNardo (1997),Econometric Methods, MacGrawHill. Korum, Uğur (1991), Sosyal Bilimlerde İstatistik, Turhan Kitabevi Yay., Ankara. Lucas,R.E. (1976), “Economic Policy Evaluation:A Critique”, in K.Brunner&A.M.Meltzer (eds),The Phillips Curve and Labour Markets, Carnegie- Rochester Conference Series on Public Policy, Vol.I, NorthHolland, Amsterdam. Maddala, G.S. & In-Moo Kim (2002), Unit Roots, Cointegration and Structural Changes, Cambridge University Press. Mills, Terence C. (1990), Time Series Techniques for Economists, Cambridge University Press, Cambridge.

63 Nelson, C.R. and C.I. Plosser (1982), “Trends and Random Walks in Macroeonomic Time Series: Some Evidence and Implications”, Journal of Monetary Economics, 10, pp Özcan, Cevriye (1994), "Trends, Cycles and Seasonality in Industrial Production and Price Indices of Turkey: Forecasting with Structural Models (Unobserved Component Model) and Detrending with HP Filter", Discussion Paper no.9403 (January), The Central Bank of The Republic of Turkey Research Department. Uygur, Ercan (2001), Ekonometri:Yöntem ve Uygulama, İmaj Yayıncılık, Ankara.

64 chi -square%20test

65 Teşekkür ederiz. Aydın&Aylin