MODEL YETERSİZLİKLERİNİ DÜZELTMEK İÇİN DÖNÜŞÜMLER VE AĞIRLIKLANDIRMA
DÖNÜŞTÜRMELER Veri dönüştürme «normallik sağlama, regresyon modelini doğrusallaştırma, ve varyans dengeleme (değişen varyanslılığı azaltma)» gibi belirli amaçları gerçekleştirmek için yapılır. Bu durumda doğrusal regresyon modeli orijinal değişkenlere değil dönüştürülmüş değişkenlere uygulanır. Veri setine basit doğrusal regresyon modelini uygun hale getirmek için bağımlı değişken Y veya bağımsız değişken X için ya da her ikisi için basit dönüşümler kullanılabilir.
DOĞRUSAL OLMAYAN İLİŞKİ Genellikle Y ile bağımsız değişkenler arasında doğrusal bir ilişki varsayımı regresyon analizinin başlangıç noktasıdır. Bazen bu varsayımın uygun olmadığını görürüz. © 2004 Prentice-Hall, Inc.
DOĞRUSAL OLMAYAN MODELLER
DOĞRUSAL OLMAYAN İLİŞKİ İÇİN DÖNÜŞÜMLER Hata terimlerinin dağılımı normal dağılıma yakınsa ve varyansı yaklaşık olarak sabit ise doğrusal olmayan bir regresyon ilişkisini doğrusal hale getirmek için dönüşümler uygulanabilir. Bu durumda X üzerine dönüşüm uygulamak istenebilir. Y üzerinde dönüşüm yapılmak istenmeyişinin nedeni örneğin . gibi bir dönüşüm hata terimlerinin dağılımının şeklini değiştirebilir ve hata terimlerinin varyansının değişiklik göstermesine neden olabilir.
DOĞRUSAL OLMAYAN İLİŞKİ İÇİN DÖNÜŞÜMLER Şekil bazı doğrusal olmayan, sabit varyanslı regresyon modellerinin prototiplerini ve doğrusallaştırmak için bu örneklere uygun olabilecek X üzerine basit dönüşümleri göstermektedir. Birkaç alternatif dönüşüm denenebilir. Dönüşümler uygulandıktan sonra serpilme diyagramları ve kalıntı diyagramları oluşturulabilir ve hangi dönüşümün daha etkili olduğuna karar verilebilir.
Bir örnek; Staj yapılan gün sayısı (X) ve performans (Y) olmak üzere bir deneyden elde edilen 10 birimlik bir örnek aşağıdaki gibidir:
örnek (a)’daki diyagramda regresyon ilişkisi eğrisel gibi görünmektedir. Dolayısıyla basit doğrusal regresyon modelinin uygun olmadığı görünmektedir. Farklı X seviyelerinde değişkenlik sabit göründüğünden X üzerinde bir dönüşüm dikkate alınacaktır. Buradaki ilişki yukarıdaki doğrusal olmayan regresyon ilişkilerini gösteren prototiplerden (a)’dakine benzer bir şekildedir. Dolayısıyla uygun dönüşüm bağımsız değişkenin karekökünü almak olacaktır:
örnek (b)’de görülebileceği gibi serpilme diyagramı anlamlı bir doğrusal ilişki göstermektedir. X’in farklı seviyelerindeki değişkenlik öncekinde olduğu gibi sabittir dolayısıyla Y üzerinde herhangi bir dönüşüm uygulanmamıştır.
örnek Basit doğrusal regresyon modelinin dönüştürülmüş X’ verisine uygun olup olmadığını görebilmek için klasik regresyon hesaplamaları yapılarak dönüştürülmüş veriyle aşağıdaki gibi bir regresyon öngörülmüştür. Kalıntı değerleri yukarıdaki tabloda verildiği gibidir.
(c)’de kalıntıların X’ ne karşı diyagramı görülmektedir (c)’de kalıntıların X’ ne karşı diyagramı görülmektedir. Bu diyagramda varyansın sabit olmadığına dair kuvvetli bir delil, görüntü bulunmamaktadır. (d) kalıntıların normal olasılık diyagramını göstermektedir. Diyagramdan gözlemlenen, normal dağılımdan aykırı sapmaların olmadığı savını desteklemektedir. Dolayısıyla dönüştürülmüş veri için basit doğrusal regresyon modeli uygun görünmektedir.
NORMAL DAĞILMAYAN VE VARYANSI SABİT OLMAYAN (HETEROSKEDASTİK) HATA TERİMLERİNİN VARLIĞINDA DÖNÜŞÜMLER Hata terimlerinin normal dağılmaması ve varyansının sabit olmaması sıklıkla birlikte gerçekleşir. Basit doğrusal regresyon modelinden bu sapmalara çözüm bulabilmek için Y üzerinde dönüşüm uygulanması gerekmektedir. Dolayısıyla Y’nin dağılımının şekli ve yayılması değişecektir. Y üzerinde bu tür dönüşümler eğrisel regresyon ilişkisinin doğrusallaştırılmasına yardımcı olabilir. Bazı durumlarda eşzamanlı X üzerindeki dönüşümler regresyon ilişkisini korumak veya sürdürmek için yapılabilir.
NORMAL DAĞILMAYAN VE VARYANSI SABİT OLMAYAN (HETEROSKEDASTİK) HATA TERİMLERİNİN VARLIĞINDA DÖNÜŞÜMLER Dönüşümler uygulandıktan sonra serpilme diyagramları ve kalıntı diyagramları oluşturularak en etkili dönüşümün hangisi olduğuna karar verilebilir.
NORMAL DAĞILMAYAN VE VARYANSI SABİT OLMAYAN (HETEROSKEDASTİK) HATA TERİMLERİNİN VARLIĞINDA DÖNÜŞÜMLER Regresyon ilişkisi doğrusal olmasına rağmen hata terimlerinin varyansı sabit değilse Y üzerinde yapılacak bir dönüşüm başarılı olmayabilir. Bu gibi bir dönüşüm varyansı stabilize ederken doğrusal ilişkinin eğrisel olmasına neden olabilir. Dolayısıyla aynı zamanda X üzerinde de bir dönüşüm gerekebilir.
BOX COX DÖNÜŞÜMLERİ Dağılımların çarpıklığını, hata terimlerinin dağılımını, sabit olmayan varyanslarını ve doğrusal olmayan regresyon fonksiyonunu düzeltmek için teşhis diyagramlarına bakılarak Y üzerinde hangi dönüşümlerin yapılacağına karar vermek zor olabilir. Box-Cox prosedürü otomatik olarak Y üzerinde kuvvet (üs) dönüşümleri ailesi tanımlar. Kuvvet dönüşümleri ailesi aşağıdaki biçimdedir:
BOX COX DÖNÜŞÜMLERİ Bu aile aşağıdaki basit dönüşümleri içermektedir: Bu dönüşümlerle klasik normal doğrusal regresyon modeli aşağıdaki biçimi alır:
BOX COX DÖNÜŞÜMLERİ
BOX COX DÖNÜŞÜMLERİ Mutlaka Box-Cox dönüşümleri yapıldıktan sonra serpilme diyagramları ve kalıntı diyagramları oluşturularak dönüşümlerin uygun olup olmadığı incelenebilir. Box-Cox prosedürü değerini 1’e yakın belirliyorsa Y üzerinde herhangi bir dönüştürme işlemine gerek yoktur.
DÖNÜŞÜMLER Bazı durumlarda teorik ya da önsel bilgilerden yararlanılarak uygun dönüştürme seçilebilir. Örneğin bir malın fiyatı (X) ile talep miktarı (Y) arasındaki bir ilişki çalışılıyorsa ekonomistler her iki Y ve X üzerinde logaritmik bir dönüşümü uygun bulabilirler. Çünkü dönüştürülmüş değişkenler için regresyon doğrusunun eğimi talebin fiyat elastikiyetini vermektedir. Burada eğim fiyatdaki yüzde bir birimlik değişmeye karşılık talepte meydana gelen yüzdelik değişmeyi vermektedir.
AĞIRLIKLI EN KÜÇÜK KARELERLE PARAMETRE TAHMİNİ Sıradan en küçük kareler ve maksimum olabilirlik yaklaşımlarında, parametre tahmini için sabit varyans varsayımı bulunmaktadır: Sabit olmayan bir varyansa sahip olunması durumunda Varyanslar ya E(Y) ortalamasına ya da diğer olası parametrelere veya olası ek açıklayıcı Z değişkenler vektörüne bağlı olabilir. Sabit varyans varsayımı sağlanmadığında başvurulan yaklaşımlardan biri bahsedilen varyans dengeleme dönüşümleridir. Bir diğer yaklaşım genelleştirilmiş veya onun özel bir durumu olan ağırlıklı en küçük karelere dayanır.
GENELLEŞTİRİLMİŞ EN KÜÇÜK KARELER
GENELLEŞTİRİLMİŞ EN KÜÇÜK KARELER
GENELLEŞTİRİLMİŞ EN KÜÇÜK KARELER (GLS)
AĞIRLIKLI EN KÜÇÜK KARELER (WLS)
AĞIRLIKLI EN KÜÇÜK KARELER (WLS)
AĞIRLIKLI EN KÜÇÜK KARELER (WLS)- Ağırlıklar bilinmiyorsa Varyans açıklayıcı değişkenlerin karelerinin bir fonksiyonu ise
AĞIRLIKLI EN KÜÇÜK KARELER (WLS)- Ağırlıklar bilinmiyorsa