PANEL VERİ ANALİZİ (Panel Data Analysis)
Panel Veri Nedir, Neden Kullanılır? Panel Verinin Avantajları Panel Veri Kullanmanın Getirdiği Kısıtlamalar Doğrusal Panel Veri Modelleri Klasik Model Sabit Etkiler Modeli Tesadüfi Etkiler Modeli Hausman Testi Uygulama
PANEL VERİ NEDİR? Bireyler, ülkeler , firmalar ve hanehalkları gibi birimlere ait ya da yatay kesit yatay kesit gözlemlerinin belli bir zaman döneminde bir araya getirilmesidir. Eğer aynı kesit birimi zaman içinde izleniyorsa bu tür karma verilere Panel Veri adı verilir. Panel veride “birim” ifadesi bir bireyi, hane halkını, ülkeyi, firmayı, sektörü vb. ifade etmek için kullanılmaktadır. Panel veri (N) sayıda birim ve her bir birime karşılık gelen (T) sayıda gözlemden oluşmaktadır. Her bir birime karşılık, bir zaman serisi vardır. Zaman boyutuna sahip yatay kesit serilerin kullanılarak ekonomik ilişkilerin tahmin edilmesi yöntemine panel veri analizi ismi verilmektedir.
PANEL VERİ NEDİR? Panel veri analizinde örneklemdeki farklı zaman noktaları için bireysel gözlemler dikkate alınır ve bu örneklemdeki her bir bireysel veri için çoklu gözlemler oluşturulması sağlanır. Yatay kesit veri birçok birim için sadece bir dönem hakkında bilgi verirken, zaman serisi verisi sadece bir birimin dönemlere göre bilgisini vermektedir. Hem dönemlere hem de birimlere göre bilgiler isteniyorsa, panel veri kullanılmalıdır. Yatay kesit verilerinin yıllar itibariyle aldıkları değerler söz konusu olduğundan panel veri analizinin temelinde tekrarlı varyans analizi ile iki yönlü ( birim ve zaman) varyans analizi modellerinin bulunduğu söylenebilir. Bu analizde genelde yatay kesit birim sayısı, dönem sayısından fazladır.
Panel Veri Seti Örneği Country Year Y X1 X2 X3 1 2000 6.0 7.8 5.8 1.3 2001 4.6 0.6 7.9 2002 9.4 2.1 5.4 1.1 2 9.1 6.7 4.1 8.3 0.9 6.6 5.0 9.8 0.4 7.2 3 0.2 2.6 6.4 4.8 5.9 3.2 5.2 6.9
Panel Veri Kullanmanın Avantajları Heterojenliği kontrol etmek. Panel veri zaman boyunca bireyler, firmalar, ülklere vb. ile ilgili olduklarından bu birimlerde bir heterojenliğin var olması kesin gibidir. Panel veri tahmin teknikleri, açık bir şekilde bu tür heterojenlikleri kesite özgü bazı değişkenlere izin vererek hesaba katabilmektedir. Zaman serisi ve yatay kesit analizi ile kıyaslandığında panel veri analizi, araştırmacıya daha geniş bir veri seti ile çalışma imkanı sunar ve trend etkisini azaltır. Bu, daha yüksek güvenilirliğe sahip parametre tahminleri, daha yüksek serbestlik derecesi ve açıklayıcı değişkenler arasında daha düşük çoklu doğrusal bağlantı, sonuç olarak daha etkin ekonometrik tahminler elde edilmesini sağlar. Panel veri yöntemi kesit ve zaman serisi gözlemlerini birleştirdiğinden gözlem sayısı daha fazladır. Panel veri değişkenler arasında daha az çoklu bağlantı (multicollinearity) sorunu oluşturur. Panel veri bir dönemden diğerine meydana gelen değişim ile mikro birimler arasındaki değişimi birleştirmek suretiyle değişkenlik meydana getirerek çoklu doğrusallığı azaltmaktadır.
Panel Veri Kullanmanın Avantajları Panel veri dinamik uyarlamaların daha iyi incelenmesini sağlar. Yatay kesit verileri dinamikler hakkında hiçbir şey söylemez. İktisadi olayları anlamada birimlerin dinamik tepkilerine ilişkin bilgi çok önemlidir. Panel veri çeşitli birimlerin dinamik tepkileri üzerine mevcut bilgiyi kullanmak suretiyle çok uzun bir zaman serisine olan ihtiyacı giderebilir. Kısa zaman serisi ve/veya yetersiz kesit gözleminin var olduğu durumlarda da ekonometrik analiz yapılmasına imkan verir. Panel veri tek başına yatay kesit ya da zaman serisi verileri ile değerlendirilemeyen konuların incelenmesinde kullanılabilir.
Panel Veri Kullanmanın Avantajları Panel veri, zaman serisi ve yatay kesit verisinden daha karmaşık davranışsal modeller yapmaya ve bunları test etmeye yardımcı olur. Herhangi bir yatay kesitte araştırma konusu olan birimlerin (firmalar, ülkeler vb.) davranışlarını etkileyen sayısız ölçülemeyen açıklayıcı değişken vardır. Bu değişkenlerin dışlanması sapmalı tahminlere neden olmaktadır. Benzer bir durum mikro birimlerin davranışlarını hep aynı yönde ancak her bir zaman döneminde farklı bir şekilde etkileyen zaman serisi değişkenlerinin dışlanması halinde de geçerlidir. Panel veri bu problemin giderilmesine olanak tanımaktadır.
Panel Veri Kullanmanın Avantajları Panel veri tek başına yatay kesit ya da zaman serisi verileri ile değerlendirilemeyen konuların incelenmesinde kullanılabilir. Zaman serisi verilerinin iyi tahminler üretmeleri için yeterince uzun olmaları gerekir ve genellikle tüm dinamik davranışlarla ilişkilidir. Yatay kesit verisi kullanılarak yapılan tahminlerde, sadece birimler arasındaki farklılıklar incelenebilirken, panel veri kullanılarak hem birimler, hem de zaman içerisinde meydana gelen farklılıklar birlikte incelenebilmektedir. Panel veri modelleri kantitatif (nicel) ve kalitatif (nitel) faktörlerin aynı model üzerinde birlikte belirlenmesine imkan vermektedir.
Panel Veri Kullanmanın Getirdiği Bazı Kısıtlamalar Panel veri ile yapılan çalışmalarda en önemli problem, verilere ulaşmak ve verileri düzenlemektir. Veri yapılarına göre, veri toplamanın ciddi bir maliyeti söz konusudur. Bu maliyet bir bireyi en az iki zaman noktasında ölçme maliyetinin yanı sıra, aynı bireyi zaman boyunca izleme zorluğundan da ileri gelir. Bu ikinci nokta, uygulamada ciddi problemler yaratır. Ayrıca sansürlü gözlemler ve özellikle anket çalışmalarında çeşitli nedenlerden dolayı cevapsız kalan sorular nedeni ile de verilerin kısıtlanması mümkündür. Panel veride genellikle, birim boyutu fazla olmasına rağmen zaman boyutu kısadır. Bu da , özellikle doğrusal olmayan panel veri modellerinde çözülmesi zor ekonometrik problemler yaratır.
PANEL VERİ DENGELİ PANEL DENGESİZ PANEL Her bir birim tüm zamanlar boyunca gözlemlenmiştir. DENGELİ PANEL PANEL VERİ Bazı birimler için bazı dönemlere ait bilgiler kayıptır. DENGESİZ PANEL Dengeli/Tamamlanmış (complate) Panel Veriler için geliştirilmiş tahmin yöntemleri ve testlerin, dengesiz/tamamlanmamış (incomplate) paneller için kullanımında bazı kısıtlamalar söz konusudur. Dengesiz Panel Veri setleri ile çalışabilmek için bazı yöntemler kullanılabilmektedir: Verilerdeki kayıp gözlemlerde tesadüfilik söz konusu ise dengeli panel için kullanılan metodlar dengesiz paneller için geliştirilebilmektedir ve tahminler tutalıdır. Kayıp gözlemi olan veriyi kaybetmektense bazı algoritmalar kullanılarak bu boşlukların doldurulması önerilebilmektedir.
Doğrusal Panel Veri Modelleri 09.01.2013 Doğrusal Panel Veri Modelleri Genel olarak doğrusal bir panel veri modeli : Modelde, i=1,2,....,N kesit birimini ve t=1,2,......,T de zaman dönemini göstermektedir. Ayrıca hata teriminin tüm zaman dönemlerinde ve tüm birimler için bağımsız ve normal dağıldığı varsayılmaktadır. Modelin tahminine geçmeden önce, parametrelerin birim ve/veya zamana göre değer almasına göre bazı varsayımlar yapılır. Sabit terim Kx1 boyutlu parametreler vektörünü k. açıklayıcı değişkenin t zamanında aldığı i. birim değeri [N(0,σu 2)] Sabit Etkili ve Tesadüfi Etkili Model Varsayımlarıdır.
Doğrusal Panel Veri Modelleri Panel veri modelleri parametrelerin birim ve/veya zamana göre değer almasına bağlı olarak aşağıdaki gibi sınıflandırılabilir; Hem sabit hem de eğim katsayılarının sabit olduğu modeller; Eğim katsayıları sabit, sabit katsayının birimlere göre değişken olduğu modeller ; Klasik Modeller uit ~ [N(0,σu 2)] Verilen her biri birim için gözlemler korelasyonsuz(bağımsız)dur. Birimlere ve zamana karşı hatalar homoskedatik (sabit varyanslı)tir. 1 Birim Etkili Modeller 2
Doğrusal Panel Veri Modelleri Eğim katsayısının sabit, sabit katsayısının birimlere ve zamana göre değişken olduğu modeller; Tüm katsayılarının birimlere göre değişken, zamana göre sabit olduğu modeller; Birim ve Zaman Etkili Modeller (Hem birim hem de zaman etkisi içermesi nedeni ile ) 3 4
Doğrusal Panel Veri Modelleri 09.01.2013 Doğrusal Panel Veri Modelleri Tüm katsayılarının hem birimlere hem de zamana göre değişken olduğu modeller ise; 5 ve numaralı modellerde, eğim katsayısı sabit iken, sabit katsayı değişkendir. 3 2 Bu modeller, panel veri analizinde en çok kullanılan modeller olup “değişken sabit katsayılı modeller” ya da “sabit katsayısı değişken modeller” olarak adlandırılırlar. Birimlere ve zamana göre farklılıkları değişik şekillerde hesaba katmak için en kolay yol, sabit katsayısı değişken olan modelleri kullanmaktır.
Panel veri analizlerinde daha çok sabit katsayısı değişken modeller ile ilgilenilmektedir. ( 2 ve 3 no.lu modeller) Bu modeller ise genel olarak katsayıların sabit ya da tesadüfi (rastgele) varsayılmasına bağlı olarak sınıflandırılabilirler. KLASİK MODEL SABİT ETKİLİ MODEL TESADÜFİ ETKİLİ MODEL
KLASİK MODEL Bu modelde, hem sabit hem de eğim katsayılarının birimlere ve zamana göre sabit olduğu yani bütün gözlemlerin homojen olduğu varsayılmaktadır. Bu model genel olarak, ifade edilebilir. Bu modelde parametreler (EKK) ya da (GEKK) yöntemleriyle kestirilir. Hata terimininin heteroskedastik (değişen varyanslılık) ve otokorelasyonlu olması nedeniyle ; GEKK kestiricileri, EKK kestiricilerinden daha etkindir. ya da
SABİT ETKİLİ MODELLER (Sabit Katsayılı Modeller) Sabit etkili modelde, birimlere göre değişiklikler sabit katsayıda farklılıklar meydana getirir. Eğim parametreleri tüm yatay kesit birimler için aynı (βi = β) iken, sabit parametre birim etki içermesi sebebiyle birimden birime değişmektedir. Diğer bir deyişle, sabit terim her bir yatay kesit birim için farklı değerler alır , yani birimler arası farklılıklar sabit terimdeki farklılıklar ile ifade edilir. Bu nedenle sabit katsayı, sabit bir değişken gibi düşünülür. Ayrıca bu modellerde bağımsız değişkenlerin, hata teriminden bağımsız olduğu varsayımı yapılır. Fakat birim etki ve bağımsız değişkenler ilişkilidir.
SABİT ETKİLİ MODELLER (Sabit Katsayılı Modeller) Genel olarak bir panel veri ele alındığında; Sabit etkili modelde, olduğu varsayılmaktadır. μi = zamana göre sabit olan birim etkileri uit = hata terimi Birim etkiyi içermesi sebebi ile sadece sabit parametre değişmekte; zamana göre sabit iken, birimlere göre farklılıklar göstermektedir.
TESADÜFİ (RASSAL) ETKİLİ MODELLER Birimler tesadüfi olarak seçildiğiklerinde, birimler arası farklılıklar da tesadüfi olacaktır. Bu birim farklılıklalarına “tesadüfi farklılıklar” denilmektedir. Regresyon analizinde genelde bağımlı değişkenin değerini etkileyen, fakat bağımsız değişken gibi modelde yer almayan çok sayıda faktör olduğu ve bu faktörlerin tesadüfi bir kalıntı tarafından özetlendiği varsayılır. Çok sayıda birim zaman göre gözlendiğinde, dışlanmış değişkenlerin bazılarının birim ve zaman periyodunun her ikisine özgü faktörleri temsil ettiği varsayılırken, diğer değişkenler sadece birim farklılıklarını yansıtacaktır.
TESADÜFİ ETKİLİ MODELLER Birinci tip değişkenler uit ile ifade edilirken; ikinci tip değişkenler birim etki μi tarafından ifade edilir. Tesadüfi etkiler modeline daha sonra anlatılacak nedenlerden ötürü, “hata bileşenleri modeli” ya da “varyans bileşenleri modeli” denilebilir. Genel panel veri denklemi; Tesadüfi etkiler modeli, Sabit değil tesadüfi olduğu varsayıldığından hata teriminin içinde İfade edilmiştir.
TESADÜFİ ETKİLİ MODELLER Tesadüfi etkiler modeli; νit : tüm hataları gösterirken, μi : birim hatayı, birim farklılıklarını ve sabit zaman göre birimler arasındaki değişmeyi gösterir. (i. yatay kesit birimin sabitini temsil eder.) Hata terimini ifade eder.
HANGİ PANEL VERİ MODELİNİ KULLANMALIYIZ ? Eğer bütün gözlemlerin homojen olduğu yani birim ve/veya zaman etkilerinin olmadığı düşünülüyorsa KLASİK MODELİ, Birim ve/veya zaman etkilerinin olduğu düşünülüyorsa SABİT YA DA TESADÜFİ ETKİLİ MODELLERİ kullanmak daha mantıklıdır. Bir çok araştırmacı sabit etkili modeli tahmin etmeyi tercih ederler çünkü; Sabit etkili modelin varsayımı olan “birim etkilerin modeldeki açıklayıcı değişkenlerle ilişkisiz olması mümküm değildir”. düşüncesi hakimdir.
HANGİ PANEL VERİ MODELİNİ KULLANMALIYIZ ? Eğer birim etkiler açıklayıcı değişkenlerle ilişkisiz ise; tesadüfi etkiler kestiricisi tutarlı ve etkindir, sabit etkiler kestiricisi tutarlı fakat etkin değildir. Eğer birim etkiler açıklayıcı değişkenlerle ilişkili ise; sabit etkiler kestiricisi tutarlı ve etkindir, tesadüfi etkiler tahmincisi tutarsızdır. Sabit ya da tesadüfi etkili modeller arasında seçim, modelin tahmin edilmesindeki amaca bağlı olarak yapılabilir. Modelin tahmininden belli bir birim için çıkarsama yapılacaksa, sabit etkili model daha uygun olacaktır. Eğer veri seti geniş bir kitlenin gözlemlerinden oluşuyorsa ve kitlenin tümü için sonuç çıkarılmak isteniyorsa, tesadüfi etkili modelin kullanılması daha avantajlıdır. Bu modellerin hangisinin kullanılacağı önsel olarak yapıldığı gibi, bu tespit bir takım testler sonucunda da yapılmaktadır.
PANEL VERİ MODELLERİ İÇİN TESTLER Bu kararı vermek için kullanılan üç tane test vardır: Tesadüfi Etkiler Testi (Lagrange Çarpanı (LM) Testi) H0 = Tesadüfi etkiler sıfırdır. (σ μ2 = 0) H0 kabul edilirse hangi modelin kullanıcağına dair ek testlere ihtiyaç vardır. Olabilirlik Oranı (LR) Testi Test istatistiği hesaplanırken sabit etkili ve klasik modelden elde edilen log-olabilirlik değerleri kullanılmaktadır H0 = Klasik Model doğrudur. (H0 red edilirse sabit etkili model uygundur.)
PANEL VERİ MODELLERİ İÇİN TESTLER Hausman Testi Sabit etkili ve tesadüfi etkili modeller arsında seçim yapmak için kullanılır. Sabit ve tesadüfi modeller arasındaki en belirgin fark, birim etkisinin bağımsız değişkenlerle ilişkili olup olmadığıdır. Hausman testi; birim etki dolayısıyla hata terimi ile açıklayıcı değişkenler arasında ilişki olup olmadığını , yani tesadüfi etkili modelin uygun olup olmadığını ölçer. Eğer hata terimi ile açıklayıcı değişkenler arasında ilişki yoksa, tesadüfi etkili model geçerlidir. H0 = Tesadüfi etkili model uygundur. H0 red edilirse sabit etkili model uygundur denir.
UYGULAMA Enerji Tüketimi ve Büyüme İlişkisi: AB Üyesi Ülkelere İlişkin Bir Panel Veri Analizi Avrupa Birliği Üyesi 27 ülke ye ilaveten ; Iceland, Macedonia, Turkey, Albania, Bosna and Herzegovina, Crotia Değişkenler; GDP per capita (current US$) CO2 emissions (metric tons per capita) Energy use (kg of oil equivalent per capita) Panel Veri Analizi Eviews 6.0 paket programı ile yapımıştır.
Panel veride gözlem etkilerini görmek için kullanılan sabit etki ve rassal etki modelleri ile parametreler tahmin edilecektir.
Sabit Etkiler Modeli ;
Bu iki modelden(sabit etki,rassal etki)hangisinin istatistiksel olarak geçerli olduğuna karar vermek gerekir. Bunun için Hausman Testi uygulanacaktır.Hausman Testinde yokluk hipotezi “rassal etki modeli”, alternatif hipotez ise “sabit etki modeli” kullanılmalıdır şeklinde kurulur. Prob.=0.000<0.05 olduğu için Ho hipotezi reddedilir.Yani sabit etki vardır diyebiliriz.Bu durumda modeli sabit etki modeli tercih edilir.
KAYNAKLAR Arı, A.,Zeren,F. (2011) CO2 Emisyonu ve Ekonomik Büyüme: Panel Veri Analizi , Yönetim ve Ekonomi Dergisi, Cilt:18, Sayı:2, Celal Bayar Üniversitesi İ.İ.B.F.,Manisa Baltagi, B.H. (2005) Econometric Analysis of Panel Data,Third Edition, John Wiley & Sons Gmbh, West Sussex, England. Ersoy, A.Y.(2012) OECD Ülkelerinde Ekonomik Büyme Odaklı Enerji Tüketiminin Ekonometrik Modeli, Ç.Ü. Sosyal Bilimler Enstitüsü Dergisi, Cilt 21, Sayı 1, 2012, Sayfa 339-356. Farhani, S., Rejeb, J.B. (2012) Energy Consumption, Economic Growth and CO2 Emissions: Evidence from Panel Data for MENA Region, International Journal of Energy Economics and Policy, Vol. 2, No. 2, 2012, pp. 71-81 Güvenek,B., Alptekin V. (2010) Enerji Tüketimi ve Büyüme İlişkisi: OECD Ülkelerine İlişkin Bir Panel Veri Analizi, Enerji, Piyasa ve Düzenleme, Cilt:1, Sayı:2, 2010, sayfa 172-193. Kulalı, İ. (1997) Elektrik Sektöründe Özelleştirme ve Türkiye Uygulaması, DPT, Ankara. Köksal, M.A, Aslanoğlu, S.Y.(2012) Elektrik Tüketimine Bağlı Karbondioksit Emisyonunun Bölgesel Olarak Belirlenmesi ve Uzun Dönem Tahmini, Hava Kirliliği Araştırma Dergisi Vol.1, 2012, sayfa 19-29. Kök, R., Şimşek, N. http://www.deu.edu.tr/userweb/recep.kok/dosyalar/panel2.pdf EMEÇ, H. http://www.kisi.deu.edu.tr/.../hamdi.emec/.../12_%20Panel%20Veri%20Analizi.ppt Reyna, O.T., Panel Data Analysis Fixed & Random Effects (Using Stata 10.x), http://dss.princeton.edu/tarining/,Princeton University. Tatoğlu,F.Y. (2005) Sermaye Piyasasında Riskin Sınırlı Bağımlı Değişkenli Panel Veri Modelleri ile Analizi, Doktora Tezi, İstanbul. Tatoğlu,F.Y. (2012) İleri Panel Veri Analizi, Beta Basımevi,İstanbul. http://data.worldbank.org/topic/environment http://en.wikipedia.org/wiki/European_Union http://data.worldbank.org/topic/energy-and-mining
09.01.2013 TEŞEKKÜRLER...