Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Regression-1 Spring 2006 Regresyon. Regression-2 Spring 2006 Regresyon Analizi Regresyon analizi sürekli(örn. aralık, oran) bir bağımlı değişken ile bir.

Benzer bir sunumlar


... konulu sunumlar: "Regression-1 Spring 2006 Regresyon. Regression-2 Spring 2006 Regresyon Analizi Regresyon analizi sürekli(örn. aralık, oran) bir bağımlı değişken ile bir."— Sunum transkripti:

1 Regression-1 Spring 2006 Regresyon

2 Regression-2 Spring 2006 Regresyon Analizi Regresyon analizi sürekli(örn. aralık, oran) bir bağımlı değişken ile bir veya daha fazla bağımsız değişken (nominali ordinal, aralık veya oran) arasındaki ilişkiyi aşağıdaki yollarla inceler: Bir değişkeni (bağımlı değişken) diğer değişkenlerin (bağımsız değişkenler) doğrusal bileşeni olarak açıklamak/ifade etmek/tahmin etmek/modellemek için kullanılır. Bağımlı değişkendeki varyansın ne kadarının bağımsız değişkenler tarafından açıklanabileceğini gösterir. Regresyon analizi değişkenler arasındaki ilişkinin yapısını ve derecesini gösterir, neden-sonuç ilişkisi göstermez.

3 Regression-3 Spring 2006 Regresyon Analizi: Temel Kullanımları Bağımsız değişkenlerin öneminin anlaşılması. Örnek: Restoranlara yönelik genel tatminde yiyecekten tatmin, hizmetten tatmin, harcanan para ve günün hangi saati olduğunun anlamlı bir etkisi var mıdır? Örnek: Restoranlara yönelik genel tatminde hangisinin etkisi daha fazladır: 1) Yiyecekten tatmin VEYA 2) Hizmetten tatmin. Bağımsız değişkenin belirli değerleri için bağımlı değişkeni tahmin etmek: Örnek: Firmanın ve rakibin promosyon harcamaları, fiyatları ve tüketicilerin gelir seviyeleri verildiğinde, gelecek üç aylık dönem için satışların tahmini ne olur. “Eğer” örneği: Eğer promosyon harcamalarımızı mevcut X-TL’den Y-TL’ye yükseltirsek gelecek üç aylık satışlarımız üzerinde etkisi ne olur?

4 Regression-4 Spring 2006 Bağımlı Değişkenin Varyansı (Y) Regresyon Analizinin Temelindeki “Varyans” Anlayışı Bağımsız Değişkenin Varyansı (X 1 ) Bağımsız Değişkenin Varyansı (X 2 ) Y’nin X 1 tarafından açıklanan varyansı Y’nin X 2 tarafından açıklanan varyansı Y’nin bağımsız değişkenlerce açıklanmayan varyansı= “Hata”

5 Regression-5 Spring 2006 Regresyon Denklemi: Basit Regresyon Örneği y = a + b 1 x 1 Kullanılan km = * Aracın yaşı hata ^ ^

6 Regression-6 Spring 2006 Regresyon Denklemi: Çoklu Regresyon Örneği Kullanılan km = *Aracın yaşı *Ailenin büyüklüğü + 500*Oturma kapasitesi ^ Kullanılan km= a + b1*Aracın yaşı + b2*Ailenin büyüklüğü + b3*Oturma kapasitesi ^

7 Regression-7 Spring 2006 Çoklu Regresyon Örneği y = gerçek bağımlı değişken y = tahmini bağımlı değişken (y-şapka olarak okunur). x i = bağımsız (i.e., predictor) değişkenler (i = 1, …, k) a = intercept (sabit) Regresyon doğrusunun y eksenini kestiği nokta Tüm bağımsız değişkenlerin (x i ) 0 olması halinde y bağımlı değişkeninin tahmin edilen değerini gösterir Eğer bağımsız değişkenlerin hepsi birlikte 0 değeri almıyorsa, kesişimin bir anlamı yoktur. b’s = regresyon veya eğim katsayıları x K sabitken, x i ’deki bir birim değişmenin y’de yol açacağı değişim miktarını gösterir. y = a + b 1 x 1 +b 2 x 2 +b 3 x b k x k ^ ^

8 Regression-8 Spring 2006 Çoklu Regresyon Örneği y = a + b 1 x 1 +b 2 x 2 + b 3 x b k x k ^ y = * x 1 – 0.18*x * x *x k ^ Örneklemde: y = δ + β 1 x 1 + β 2 x 2 + β 3 x β k x k ^ Anakütlede:

9 Regression-9 Spring 2006 Unutmayalım.. Regresyon sadece düzgün bir çizgiye uyar..

10 Regression-10 Spring 2006 Çoklu Regresyonun Bazı Özellikleri Bağımlı DeğişkenBağımsız Değişken Bir Üründen Tatmin1.Ürünün her bir özelliğinden tatmin 2.Ürünle ilgili deneyim 3.Rakip ürünlerin değerlendirmesi 4.Demografikler Sınavdaki başarı1.Hazırlık 2.Motivasyon 3.Gerçek yetenek 4.Sınavın zorluğu 5.Demografikler Yeniden satın alma niyeti1.Üründen tatmin 2.Hizmetten tatmin 3.Ürüne ihtiyaç 4.Ürünün fiyatı 5.Rakip ürünlerin fiyatı Bir restorandan genel tatmin1.Yemekten tatmin 2.Hizmetten tatmin 3.Harcanan miktar(YTL) 4.Günün saati

11 Regression-11 Spring 2006 Regresyon analizi gerçekleştirme Modeli oluşturModeli hesapla(ör., R 2, Sabit, katsayılar, vs.)Anlamlılığı test et 1) Model ve 2) Sabit & KatsayılarBağımlı ve bağımsız değişkenleri belirle

12 Regression-12 Spring 2006 Regresyon Analizinde Anlamlılık Testi 1.Modelin bir bütün olarak anlamlılığının ölçümü (yani, modelin genelinin anlamlılığı) 2.Bağımsız ilişkilerin anlamlılığının ölçümü a)Sabitin anlamlılığı b)Her bir katsayının anlamlılığı yani, her bir bağımsız değişkenin bağımlı değişken üzerindeki etkisinin anlamlılığı

13 Regression-13 Spring 2006 Regresyon: İstatistik Örneği Tatmin ölçeği aralığı 1’den (Tatmin olmamış) 9’a (Tatmin olmuş). Harcanan para dolar cinsindendir. Günün saati: 1=Sabah; 2=Öğleden sonra; 3=Akşam.

14 Regression-14 Spring 2006 Regresyon: İstatistik Örneği: MS-Excel Çıktısı GenelTat = a + b 1 *YiyecekTat+ b 2 *HizmetTat + b 3 *Harc + b 4 *GününSaati ^ a b1b1 b2b2 b3b3 b4b4 GenelTat = *YiyecekTat *HizmetTat *Harc– *GününSaati ^

15 Regression-15 Spring 2006 Regresyon Örneği GenelTat = a + b 1 *YiyecekTat + b 2 *HizmetTat + b 3 *Harc + b 4 *GününSaati ^ GenelTat = δ + β 1 *YiyecekTat + β 2 *HizmetTat + β 3 *Harc+ β 4 *Günün Saati ^ Örneklemde: In the population: GenelTat = *YiyecekTat *HizmetTat *Harc – *GününSaati ^

16 Regression-16 Spring Modelin bir bütün olarak anlamlılığının ölçümleri 1)Multiple R: Bağımlı değişkenin öngörülen ve asıl değerleri arasındaki korelasyon. 2)R 2 (R-kare 0 ve 1 arasında değer alır) = (Multiple R) 2 = Regression SS/Total SS = bağımlı değişkenin varyansının bağımsız değişkenlerce x 1, x 2, …, x k açıklanan kısmının yüzdesi 3)Düzeltilmiş R 2 = Modeldeki bağımsız değişken sayısına göre R 2 ‘yi “düzeltir”. Çoğu zaman R 2 “yapay” olarak büyür çünkü modele çok sayıda bağımsız değişken dahil edilmiştir ancak bağımsız değişkenlerin bağımlı değişken üzerinde anlamlı bir etkisi yoktur. Düzeltilmiş R 2 gerçek R 2 ’yi yapay artışın etkisinden arındırır “düşürür”. Böylece, düzeltilmiş R 2 her zaman gerçek R 2 ’den daha küçük veya ona eşit olur, ama asla daha büyük olmaz. Multiple R, R 2 ve Düzeltilmiş R 2 ‘nin büyük olması tercih edilir çünkü bu daha iyi bir model anlamına gelir. Yani, bağımsız değişkenler bağımlı değişkenleri iyi bir şekilde açıklamakta/tahmin etmekte/etkilemektedir. Standart hata: Hata değerlerinin standart sapması (Hata = Bağımlı değişkenin gerçek değeri – Bağımlı değişkenin öngörülen değeri). Gözlem sayısı: Örneklem sayısı.

17 Regression-17 Spring 2006 Regression df (Regresyonun serbestlik derecesi) = Modeldeki bağımsız değişken sayısı = k. Error df (Hatanın serbestlik derecesi) = (Örnek büyüklüğü- Modeldeki bağımsız değişken sayısı – 1) = (n – k -1) Total df (Toplam serbestlik derecesi) = (Örnek büyüklüğü - 1) = (n -1) Not: Toplam df = Regression df + Error df Total SS (Toplam kareler toplamı) = gerçek bağımlı değişkenlerin değerlerinin varyansı * (n-1) Regression SS (Regresyon kareleri toplamı) = tahmini bağımlı değişkenlerin varyansı * (n-1) Error SS (Hata kareleri toplamı) = hata değerlerinin varyansı * (n-1) Not: Toplam SS = Regression SS + Error SS Regression MS (Regression Mean Squared): Regression SS/Regression df Error MS (Error Mean Squared): Error SS/Error df 1. Modelin tamamının anlamlılığının ölçümü

18 Regression-18 Spring 2006 Measures of significance of the model as a whole 4)Regression F-değeri (Model F) = Regression MS/Error MS Significance F = p-value of Model F Regresyonun F değeri (F Hesaplanan ) izleyen hipotez için: H 0 : β 1 = β 2 = β 3 = ……= β k = 0 H 1 : En azından bir β ≠ 0 Tüm hipotez testlerinde, F Hesaplanan F Tablo ile karşılaştırılmaktadır. Ve eğer F Hesaplanan > F Tablo ise yukarıda yer alan H 0 reddedilir ve H 1 kabul edilir. Pek çok yazılımda sadece F Hesaplanan verilir ve F tablo verilmez. Yine de F Hesaplanan ‘ın F Tablo ‘dan büyük olup olmadığını tahmin edebiliriz veya Model F’in (yani F Hesaplanan ) p değerini anlamlılık düzeyi ile karşılaştırabiliriz ( α). Eğer (p-value F Tablo ) o zaman H 0 REDDEDİLİR ve H 1 KABUL EDİLİR. 1. Modelin tamamının anlamlılığının ölçümü Modelin tamamının anlamlılığının ölçümü: H 0 : β 1 = β 2 = β 3 = ……= β k = 0 vs. H 1 : En az bir β ≠ 0

19 Regression-19 Spring 2006 Measures of significance of individual relationships 1)Intercept katsayısı = “a”nın örneklem tahmini. a’nın anakütle karşılığı δ’dır. 2)Intercept katsayısının standart hatası = “a”nın standart sapması 3)Intercept’in t-istatistiği = (Intercept Katsayısı– 0)/ Intercept Katsayısının Standart Hatası = t Hesaplanan 4)t-istatistiği şu hipotezler için t Hesaplanan ‘dır: H 0 : δ = 0 vs. H 1 : δ ≠ 0 Tüm hipotez testlerinde olduğu gibi t Hesaplanan t Tablo ile karşılaştırılır. Çift kuyruklu bir test olarak karar verme kuralı şöyledir: eğer t Hesaplanan > t Tablo VEYA t Hesaplanan < -t Tablo ise H 0 REDDEDİLİR. Her ne kadar yazılım bize t Tablo değerinin ne olduğunu söylemese de, Intercept’in p- değerine bakıp anlamlılık seviyesi ( α) ile karşılaştırarak bir çıkarım yapabiliriz. Eğer (p-değeri t Tablo ) VEYA (t Hesaplanan < - t Tablo )] ise H 0 REDDEDİLİR ve H 1 KABUL EDİLİR. 2. Bağımsız ilişkilerin anlamlılığının ölçümü Intercept’in anlamlılığının ölçümü: H 0 : δ = 0 vs. H 1 : δ ≠ 0

20 Regression-20 Spring 2006 Measures of significance of individual relationships 1)Bağımsız değişken katsayısı = “b.”’nin örneklem tahmini. b’nin anakütle karşılığı β’dır. 2)Bağımsız değişken katsayısının standart hatası = “b 1 ”’in standart sapması 3)Bağımsız değişken katsayısının t-istatistiği = (Katsayı – 0)/ Katsayının standart hatası = t Hesaplanan 4)t-istatistiği şu hipotezler için t Hesaplanan ‘dır: H 0 : β 1 = 0 vs. H 1 : β 1 ≠ 0 Tüm hipotez testlerinde olduğu gibi t Hesaplanan t Tablo ile karşılaştırılır. Çift kuyruklu bir test olarak karar verme kuralı şöyledir: eğer t Hesaplanan > t Tablo VEYA t Hesaplanan < -t Tablo ise H 0 REDDEDİLİR. Her ne kadar yazılım bize t Tablo değerinin ne olduğunu söylemese de, Intercept’in p- değerine bakıp anlamlılık seviyesi ( α) ile karşılaştıarak bir çıkarım yapabiliriz. Eğer (p-değeri t Tablo ) VEYA (t Hesaplanan < -t Tablo )] ise H 0 REDDEDİLİR ve H 1 KABUL EDİLİR. 2. Bağımsız ilişkilerin anlamlılığının ölçümü Bağımsız değişkenlerin katsayılarının anlamlılığının ölçümü: H 0 : β i = 0 vs. H 1 : β i ≠ 0

21 Regression-21 Spring 2006 Regresyon: İstatistik Örneği Tatmin ölçeği aralığı 1’den (Tatmin olmamış) 9’a (Tatmin olmuş). Harcanan para dolar cinsindendir. Günün saati: 1=Sabah; 2=Öğleden sonra; 3=Akşam.

22 Regression-22 Spring 2006 Regresyon: İstatistik Örneği: MS-Excel Çıktısı Genel Tat = a + b 1 *YiyecekTat+ b 2 *HizmetTat+ b 3 *Harc + b 4 *GününSaati ^ a b1b1 b2b2 b3b3 b4b4 GenelTat = *YiyecekTat *HizmetTat *Harc – *GününSaati ^

23 Regression-23 Spring 2006 Regresyon Örneği GenelTat = *YiyecekTat *HizmetTat *Harc– *GününSaati 1.R 2 nedir? Ne anlama gelir? 2.R nedir? Ne anlama gelir? anlamlılık seviyesinde (H 0 : β 1 = β 2 = β 3 = β 4 = 0 vs. H 1 : En az bir β ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? anlamlılık seviyesinde (H 0 : δ = 0 vs. H 1 : δ ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? anlamlılık seviyesinde (H 0 : β 1 = 0 vs. H 1 : β 1 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? anlamlılık seviyesinde (H 0 : β 2 = 0 vs. H 1 : β 2 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? anlamlılık seviyesinde (H 0 : β 3 = 0 vs. H 1 : β 3 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? anlamlılık seviyesinde (H 0 : β 4 = 0 vs. H 1 : β 4 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? ^

24 Regression-24 Spring 2006 Regresyon Örneği 1.R 2 nedir? Ne anlama gelir? R 2 = Bu, bağımlı değişkenin varyansının %59.72’sinin yiyecekten tatmin, hizmetten tatmin, harcanan para ve günün saati değişkenlerini içeren regresyon modeli tarafından açıklanabileceği anlamına gelir. 2.R nedir? Ne anlama gelir? R = Restorandan genel tatminin gerçek ve tahmini değeri arasındaki korelasyonun olduğunu gösterir. Eğer bu korelasyon katsayısının karesini alırsak R-kare değeri elde edilir. Yani, =

25 Regression-25 Spring 2006 Regresyon Örneği anlamlılık seviyesinde ölçülen (H 0 : β 1 = β 2 = β 3 = β 4 = 0 vs. H 1 : At least one β ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? Model F’nin p-değeri = anlamlılık seviyesinden daha küçük olduğunu için, H 0 : β 1 = β 2 = β 3 = β 4 = 0 reddedilir ve H 1 : En az bir β ≠ 0 kabul edilir. Yani, yiyecekten tatmin, hizmetten tatmin, harcanan para ve günün saati bağımsız değişkenlerinden en azından bir tanesi genel tatminin anlamlı bir açıklayıcısıdır.

26 Regression-26 Spring 2006 Regresyon Örneği 4.(H 0 : δ = 0 vs. H 1 : δ ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? Intercept p-değeri = anlamlılık seviyesinden küçük olmadığı için, H 0 : δ = 0 reddedemiyoruz ve bu yüzden H 0 : δ = 0 kabul ediyoruz. Bu, intercept’in tahmini değerinin (0.8487) 0’dan anlamlı bir şekilde farklı olmadığı anlamına gelir. Eğer intercept’in tahmini istatistiki olarak anlamlı olsaydı, bu durum tüm bağımsız değişkenler 0’a eşitken bağımlı değişkenin tahmin değerinin istatistiki olarak anlamlı olduğunu gösterirdi. AMA: Yiyecekten tatmin, hizmetten tatmin, harcanan para ve günün saati değişkenlerinin sıfır değeri olmadığı için, bu örnekte, intercept anlamlı değildir.

27 Regression-27 Spring 2006 Regresyon Örneği anlamlılık seviyesinde ölçülen (H 0 : β 1 = 0 vs. H 1 : β 1 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? b 1 p-değeri = anlamlılık seviyesinden küçük olduğu için, H 0 : β 1 = 0 reddedilir veH 1 : β 1 ≠ 0 kabul edilir. Yani, hizmetten tatmin, harcanan para ve günün saati değişkenleri sabitken, yiyecekten tatmin 1 birim artırılırsa (yani, ölçekte 1 puan), tahmini genel tatmin b 1 birim artar (yani, puan) ve bu artış istatistiki olarak 0’dan büyüktür. Yani, hizmetten tatmin, harcanan para ve günün saati değişkenleri sabitken, yiyecekten tatmin restorandan genel tatminin anlamlı bir açıklayıcısı/etkileyicisi/tahmin edicisidir.

28 Regression-28 Spring 2006 Regresyon Örneği anlamlılık seviyesinde ölçülen(H 0 : β 2 = 0 vs. H 1 : β 2 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? b 2 ’nin p-değeri = anlamlılık seviyesinden küçük olduğu için, H 0 : β 2 = 0 reddedilir veH 1 : β 2 ≠ 0 kabul edilir. Yani, yiyecekten tatmin, harcanan para ve günün saati değişkenleri sabitken, hizmetten tatmin 1 birim artırıldığında, restorandan genel tatmin b 2 birim kadar artacaktır (yani, puan) ve bu artış istatistiki olarak 0’dan büyüktür. Yani, yiyecekten tatmin, harcanan para ve günün saati değişkenleri sabitken, hizmetten tatmin restorandan genel tatminin anlamlı bir açıklayıcısı/etkileyicisi/tahmin edicisidir.

29 Regression-29 Spring 2006 Regresyon Örneği anlamlılık seviyesinde ölçülen (H 0 : β 3 = 0 vs. H 1 : β 3 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? b 3 ’ün p-değeri = anlamlılık seviyesinden küçük olduğu için, H 0 : β 3 = 0 reddedilir ve H 1 : β 3 ≠ 0 kabul edilir. Yani, yiyecekten tatmin, hizmetten tatmin ve günün saati değişkenleri sabitken, harcanan para 1 birim artırıldığında (yani 1 dolar), restorandan genel tatmin b 3 birim kadar artacaktır (yani, puan) ve bu artış istatistiki olarak 0’dan büyüktür. Yani, yiyecekten tatmin, hizmetten tatmin ve günün saati değişkenleri sabitken, harcanan para restorandan genel tatminin anlamlı bir açıklayıcısı/etkileyicisi/tahmin edicisidir.

30 Regression-30 Spring 2006 Regresyon Örneği anlamlılık seviyesinde ölçülen (H 0 : β 4 = 0 vs. H 1 : β 4 ≠ 0) hipotez testinin sonucu nedir? Ne anlama gelir? b 4 ’ün p-değeri = anlamlılık seviyesinden küçük olmadığı için, H 0 : β 4 = 0’ı reddedemiyoruz ve bu nedenle β 4 = 0 kabul ediyoruz. Yani, yiyecekten tatmin, hizmetten tatmin ve harcanan para değişkenleri sabitken, günün saati 1 birim artırıldığında (yani günün bir bölümü), restorandan genel tatmin b 4 birim kadar azalacaktır (yani, puan) ve bu artış istatistiki olarak 0’dan küçük değildir. Yani, yiyecekten tatmin, hizmetten tatmin ve harcanan para değişkenleri sabitken, günün saati restorandan genel tatminin anlamlı bir açıklayıcısı/etkileyicisi/tahmin edicisi değildir.

31 Regression-31 Spring 2006 Regresyon Örneği-Açıklayıcılar ve Eğerler Aşağıdaki koşullarda tahmini Genel Tatmin ne olur: 1)Yiyecekten Tatmin=6, Hizmetten Tatmin=4, Harcanan Para=$15, ve Günün Saati=Öğleden sonra = * * *15 – *2 = )Yiyecekten Tatmin =Ortalaması, Hizmetten Tatmin=Olası en yüksek, Harcanan Para=Ortalaması, ve Günün Saati=Akşam = * * *19.38 – *3 = 8.69 GenelTat = *YiyecekTat *HizmetTat *Harc– *GününSaati ^

32 Regression-32 Spring 2006


"Regression-1 Spring 2006 Regresyon. Regression-2 Spring 2006 Regresyon Analizi Regresyon analizi sürekli(örn. aralık, oran) bir bağımlı değişken ile bir." indir ppt

Benzer bir sunumlar


Google Reklamları