Model Geçerliliğinin Belirlenmesi

Slides:



Advertisements
Benzer bir sunumlar
Çıkarımsal İstatistik
Advertisements

Bölüm 5 Örneklem ve Örneklem Dağılımları
Kütle varyansı için hipotez testi
Temel Bİleşenler Analİzİ
Kalibrasyon.
T Dağılımı ve t testi.
İstatistik Tahmin ve Güven aralıkları
R2 Belirleme Katsayısı.
Verilerin Değerlendirilmesi ve Sunulması
ANOVA.
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
MATEMATİKSEL PROGRAMLAMA
Tanımlayıcı İstatistikler
Veri Toplama, Verilerin Özetlenmesi ve Düzenlenmesi
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
İleri İstatistik Teknikleri
İlişkisel Veri Analizi
STANDART SAPMA ARAŞ.GÖR. MURAT TANDOĞAN

Veriyi Dönüştürme, Belirleme Limiti
Regresyonla Etkensel Deneylerin İncelenmesi
Prof. Dr. Hüseyin BAŞLIGİL
T Dağılımı.
Temel İstatistik Terimler
Değişkenlik Ölçüleri.
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
yunus.hacettepe.edu.tr/~tonta/courses/spring2008/bby208/
İKİNCİ DERECEDEN FONKSİYONLAR ve GRAFİKLER
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
Ölçme sonuçları üzerinde yapılan istatiksel işlemler
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
TANIMLAYICI İSTATİSTİKLER
Madde Analizi Yrd. Doç. Dr. Cenk Akbıyık.
Eğer bir X t zaman serisi, E(X t ), ve X t ile X t+s arasındaki anakitle kovaryansı t’den bağımsız ise durağandır. 1 DURAĞAN SÜREÇ.
14.ULUSAL TURİZM KONGRESİ 2013 YILI BİLDİRİLERİ ÜZERİNE BİR DEĞERLENDİRME Prof. Dr. A. Celil ÇAKICI Mersin Üniversitesi Turizm Fakültesi.
Neden İki Faktörlü Anova Yapıyoruz?
Betimleyici İstatistik – I
Örnekleme Yöntemleri Şener BÜYÜKÖZTÜRK, Ebru KILIÇ ÇAKMAK,
İSTATİSTİKTE GÜVEN ARALIĞI VE HATALAR
KRUSKAL WALLIS VARYANS ANALİZİ
Ölçme Sonuçlarının Değerlendirilmesi
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
Uygulama I.
HİPOTEZ TESTLERİNE GİRİŞ
Örneklem Dağılışları.
Asimetri ve Basıklık Ölçüleri
İki Değişkenli Tablo ve Grafikler
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Sayısal Tanımlayıcı Teknikler
Uygulama 3.
Gelir Dağılımında Eşitsizlik
Örneklem Dağılışları ve Standart Hata
Bölüm 03 Sayısal Tanımlama Teknikleri
Değişkenler Arasındaki İlişkiler
Regresyon Analizi İki değişken arasında önemli bir ilişki bulunduğunda, değişkenlerden birisi belirli bir birim değiştiğinde, diğerinin nasıl bir değişim.
REGRESYON VE KORELASYON ANALİZLERİ
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Prof. Dr Hamit ACEMOĞLU Tıp Eğitimi AD
Eğitimde ve Psikolojide ÖLÇME VE DEĞERLENDİRME
DEĞİŞİM ÖLÇÜLERİ.
BİLİMSEL ARAŞTIRMA YÖNTEMLERİ ÜNİTE 9
KLASİK TEST KURAMI VE GÜVENİLİRLİK
Temel İstatistik Terimler
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
Sapma (Dağılma) ölçüleri
Uygulama I.
DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA
Temel İstatistik Terimler
DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA
Sunum transkripti:

Model Geçerliliğinin Belirlenmesi Doç. Dr. İ. Safa GÜRCAN

Model geçerliğinde kullanılan ölçüler Artık Analizi (Uzak, Etkili ve Aykırı gözlemler) Artık grafikleri Değişen Varyans Çoklu Bağlantı Hataların Normal Dağılımı Hatalar arası ilişki

Artık(Residual)Analizi Y A: X ve Y eksenleri için aşırı bir değer. Regresyon eğrisi üzerinde olduğundan ß katsayılarında değişiklik yaratmaz. Katsayının standart hatasını etkiler. Artık değeri küçüktür ve genelde modelde problem yaratmaz. A B + + + + + + ++++ + + + + + + + + + + + B: X uzayında ortadadır. Ancak, aykırı ve etkili bir gözlemdir. Artık değeri büyüktür. Artık varyansını dolayısıyla ß regresyon katsayısının varyansını değiştirecektir. Doğrunun Y ekseni ile kesim noktasını değiştirir. + + + + + + + + + + + C X * İnceleme sonunda sorunlu gözlemler hemen silinmemeli, sorunlu olanlar olmadan yeni model oluşturularak karşılaştırılmalı. Silme yerine veri eklenerek sorunlar ortadan kaldırılabilir. C: Açık bir şekilde aykırı değerdir. Regresyon katsayısında değişikliğe neden olur, etkili bir gözlemdir.

Gözlem Uzaklıklarının Araştırılması X uzayında aykırı değer olan bir gözlem büyük gözlem uzaklığına sahiptir. Pii ile gösterilen gözlem uzaklığı 0-1 arasında değişir. 1’e yaklaştıkça gözlemin merkeze olan uzaklığı artar. İse gözlem büyük gözlem uzaklığına sahiptir. (high leverage) * SPSS de Pii Lev_1 artığına 1/30 eklenerek hesaplattırılır. Mahalanobis Uzaklığı: Uzak gözlem incelenmesinde kullanılan bir diğer yöntemdir. Diğer gözlemlerden farklı büyüklükteki Mahalanobis uzaklığına sahip gözlem etkili gözlemdir. + Pii + 1 2 3 4 …. 21 22 23 Gözlem no

Aykırı Gözlemlerin incelenmesi Model bozukluklarının ve aykırı değerlerin belirlenmesinde kullanılan ölçülerdir. Artık incelemesinde sıklıkla kullanılan artık türleri: 1- Ham artık 2- Standart artık 3- Student türü artık Veri setinde gözlem sayısı arttıkça, artık incelemesinin güvenirliği de artmaktadır.

Ham Artık Ham ya da ölçeklenmemiş artık olarak tanımlanır. Artık toplamı 0 olmakla birlikte varyansı örneklemden örnekleme değişir. Varyansın değişkenliği sorunu, artıkların standartlaştırılması ile giderilmeye çalışılır.

Standartlaştırılmış Artık (Standardized residual) Artıkların standart sapmaya bölünmesi ile elde edilir. Artıkların %95’inin çoğunlukla [+2 -2] sınırları arasında değiştiği kabul edilir. Bu değerlerin dışına çıkan gözlemlere aykırı değer yaklaşımı ile bakılması önerilir.

Student türü Silinmiş Artıklar Student türü Artıklar Artıklar her zaman N(0,1) ile normal dağılım göstermeyebilirler. [+2 -2] sınırları dışına çıkan gözlemlerin aykırı gözlem olabileceği düşünülmelidir. Student türü Silinmiş Artıklar Silinmiş Artıklar PRESS Sorunlu olan gözlemin dışarıya çıkarıldıktan sonra, kestirim denklemi üzerine yapacağı değişikliğin incelenmesidir. Genellikle student türü artık ile Student türü silinmiş artık arasında çok az bir fark vardır. Genel olarak önerilen bir yaklaşım bir kesim noktasına dayanmadan görsel bir yaklaşımla artıkların incelenmesidir.

Etkili gözlemlerin araştırılması Bazı gözlemlerin veri setine eklenmesi veya çıkartılması regresyon katsayılarında ve Yi kestirim değerlerinde önemli değişikliğe neden olur. Bu tip gözlemlere etkili gözlem denir. Etkili gözlemleri belirlemede kullanılan uzaklık ölçüleri Cook Uzaklığı DFBETA DFITS Kovaryans Oranı

Cook Uzaklığı: Gözlem uzaklığı ve Student türü artıklara dayanır. Büyük cook uzaklığı değerlerine sahip olan gözlemlerin regresyon katsayıları üzerine etkisi önemlidir. Etkili gözlemi belirlemenin yolları; 1-Eğer Cook ≥ 1 ise gözlem etkilidir. 2-Gözlem sayısının az olduğu durumlar için; cook ≥ 4/(n-p-1) veya bazı kaynaklarda cook ≥4/(n-2) eşitsizlikleridir. 3-Bir diğer yol; gözlem sıra numaraları X eksenine Cook uzaklıkları Y eksenine konularak yapılan saçılım grafiği en görsel olanıdır.

DFBETA i.ci gözlem veriden çıkarıldıktan sonra regresyon katsayısının ne kadar değiştiğini göstermek için geliştirilmiştir. Olması bu gözlemin dikkatlice incelenmesini gerektirir. Bazı kaynaklar bu kesim noktasının n>100 olduğu durumlarda kullanılmasını önerir.

DFITS i.gözlemin kestirim değeri üzerine etkisini incelemek için geliştirilmiştir. Aşağıdaki eşitsizlikleri sağlayan gözlemler etkili gözlemdir.

Kovaryans Oranı(KO) Kestirilen regresyon katsayılarının tümü üzerine bir gözlemin ölçüsü olarak tanımlanır. KOi 1’e yakın ise i.gözlemin kestirimin doğruluğu üzerine etkisi azdır Koi>1 ise gözlemin kestirimin doğruluğunu artırdığı Koi <1 ise gözlemin kestirimin doğruluğunu azalttığı söylenir. Eşitsizliklerini sağlıyorsa i. gözlem etkili gözlemdir.