REGRESYON VE KORELASYON ANALİZLERİ
REGRESYON ANALİZİ Regresyon analizi iki değişken arasında sebep-sonuç ilişkisini ararken, sebep-sonuç ilişkisini ortaya çıkarmaz. Meselâ, pazarlama personeli sayısı ile satışlar arasında bir sebep-sonuç ilişkisi arayabiliriz. İlişkinin varlığı ispatlanırsa, personel sayısı artıkça, satışların da artacağı anlamına gelmez. Bu ispat, sadece iki değişken arasında bir birlikteliğin olduğunu gösterir.
Basit Doğrusal Regresyon Analizi Doğrusal regresyon analizi biri bağımlı, diğeri bağımsız değişken arasında nedensellik (illiyet) ilişkisi arayan bir analiz olup, değişkenler arasındaki ilişkiyi tahmin etmeye yarar. Regresyon analizi aşağıdaki sorulara cevap arar Bağımsız değişken, bağımlı değişkendeki değişimleri açıklıyor mu? Söz konusu bu ilişkinin matematiksel olarak yapısı ve formu nasıldır? Bağımlı değişkenin tahminî değerleri nelerdir? Bağımsız değişkene gözlem dışı bir değer verildiğinde, bağımlı değişkenin değeri ne olur? Belli bir değişkenin ya da değişkenler setinin katkılarını değerlendirirken, diğer bağımsız değişkenler kontrol edilebilir mi?
Basit Doğrusal Regresyon Modelinin Aşamaları
Regresyon Modelinin Formülasyonu Regresyon analizi iki değişken arasında fonksiyonel bir ilişkiyi açıklar. Böyle bir ilişkide bağımsız değişken X ile bağımlı değişken Y ile ifâde edilirse, iki değişken arasındaki fonksiyonel ilişki Y = f(X) şeklinde yazılabilir. X’e verilen Xi gibi bir değer yerine konulursa Y tahmin edilebilir. Bu denklemde f(X) = Y olduğuna göre 0 bir sabit olup, X=0 iken regresyon doğrusunun Y ekseni üzerindeki başlangıç noktasıdır. f(X) = 0 + 1 Xi
Bir Regresyon Modelinin Serpme Diyagramı
Regresyon Modelinin Uygulanması Yıllara Göre Bulak A. Ş.’nin Satışları ve Tutundurma Harcamaları Gözlemler Tutundurma Harcamaları Satışlar 1996 10 1997 4 18 1998 8 14 1999 12 26 2000 16 22 2001 20 30 Toplam 60 120
Regresyon Denkleminin Hesaplanması xi yi xi2 10 -10 100 4 18 -6 -2 12 36 16 8 14 64 26 2 6 144 22 256 20 30 400 60 120 248 280 880
Bu katsayıları = a + bx doğrusal denklemde yerine koyarsak, Eğer firmamız hiçbir tutundurma faaliyetinde bulunmazsa, yâni, x=0 olursa, satışlarımız tahminen =11.143 + 0.8857(10) = 11.143 olur = 11.143+0.8857x
Çoklu Regresyon Analizi Bir olayın sonuç olarak doğmasına sebep olan faktörler genelde birden fazladır. Onun için regresyon modelinde bir bağımlı değişkenle birden fazla bağımsız değişkenin ilişkisi aranabilir. Çoklu regresyon, basit regresyon gibi, pazarlama ile ilgili birçok soruya cevap bulabilir. Satıştaki değişmeler; reklâm harcamaları, fiyatlar ve dağıtım düzeyleri gibi birden fazla bağımsız değişkenle açıklanabilir mi? Pazar paylarındaki değişmeler; satış gücü hacmi (sayısı), reklâm harcamaları ve satış özendirme bütçesi ile açıklanabilir mi? Y = 0 + 1 X1+2 X2+3 X3+ ... +k Xk +
Örnek : 12 satış bölgesi olan Em ilaç firmasının bölgeler itibariyle satışları ve her bölgede çalışan eleman sayısı ile o bölgede kullanılan araba sayıları aşağıda verilmiştir. Bu bölgeler itibariyle satışlar ile eleman sayısı ve elemanların kullandığı satış arabası sayısı arasında bir ilişkinin varlığı araştırılmak istensin.
Bölgeler Aylık Satışlar (Y) Eleman Sayısı (X1) Araba Sayısı (X2) 1 6 10 3 2 9 12 11 8 4 5 7 18 17
Korelasyon Katsayıları Varyans Analizi Sonuçları SPSS paket programına bu veriler girildikten sonra “Analyze” komutundan “Regression” şıkkı seçilir. Buradan da “Linear” seçeneği tıklanır. “OK” denildiğinde çıktıda aşağıdaki sonuçları göreceğiz. Korelasyon Katsayıları Çoklu korelasyon R 0.972 R2 0.945 Düzeltilmiş R2 0.933 Standart hatâ 0.860 Varyans Analizi Sonuçları Serbestlik Derecesi Kareler Toplamı Kareler Ortalaması Regresyon 2 114.264 57.132 Kalıntılar 9 6.652 0.739 F Değeri: 77.294 Anlamlılık Düzeyi: .000
Denklemdeki Değişkenler Beta (Standardize Edilmiş Katsayılar) Standart Hatâlar Beta (Standardize Edilmiş Katsayılar) t Anlamlılı k Sabit 0.337 0.567 0.595 x1 0.481 0.059 0.764 8.16 0.000 x2 0.289 0.086 0.314 3.35 0.009 Y = 0.337 + 0.481x1 + 0.289x2 Yeni bir bölge açmak istediğimizi düşünelim. Bu bölgede 15 eleman çalıştırmak istediğimizi ve bu bölgeye sadece 6 araba tahsis edebileceğimizi düşünelim. Bu denkleme göre yeni bölgede satışlarımız tahminen 9.29 olacaktır. y= 0.337 + 0.481(15) + 0.289(6) = 9.29
Araba sayısının sabit kalması şartıyla, bir bölgeye alınan yeni bir eleman, aylık satışlarda muhtemelen 0.481 artışa sebep olacaktır. Aynı şekilde, Eleman sayısının sabit kalması şartıyla, bir bölgeye alınan ek bir yeni araba satışların aylık 0.289 artmasına sebep olabilir. Her iki bağımsız değişken katsayılarının pozitif olması, bağımsız değişkenlerle bağımlı değişken arasındaki ilişkinin aynı yönde yâni, pozitif olduğunu göstermektedir. F değeri 77.29’nin 0.00 anlamlılık düzeyinde geçerli olması, modelin bir bütün olarak geçerli olduğunu ve iki bağımsız değişkenin, bağımlı değişkendeki değişmelerin %93.3’ünü açıkladığını göstermektedir. Bağımsız değişkenler x1 ve x2’e ait katsayıların t değerlerinin 0.00 ve 0.009 anlamlılık düzeylerinde geçerli olmaları, katsayıların da anlamlı olduğunu göstermektedir. Ancak eleman sayısını temsil eden x1’in t değeri olan 8.16’nın, araba sayısını temsil eden x2’nin t değeri olan 3.35’ten büyük olması, x2’ye nazaran, x1’in bağımlı değişkendeki değişmeleri daha iyi açıkladığını ispatlamaktadır.
Lojistik Regresyon Analizi Gözlemleri, bir model dâhilinde tahmini grup üyeliklerine atamak ve bağımsız değişkenler arasındaki ilişkileri incelemek için lojistik regresyon kullanılır. Başka bir ifadeyle lojistik regresyonda, konuyla ilgili değişkenlere bakarak, bir olayın, bir tercihin veya bir durumun gerçekleşme olasılığı hesaplanır.
Lojistik Regresyon Modelinin Yazımı Bireyin incelenen duruma sahip olma olasılığına (meselâA markasını tercih etme) p olarak kabul edelim. Regresyon eşitliğinde lojistik dönüşüm uygulanır. Olasılığın logit değeri e tabanına göre hastalığın odds oranının logaritmasıdır. b0 + b1 Xi + ei
Odds oranı (Odds ratio: Exp(B): Odds oranı, lojistik regresyonu yorumlamada çok önemli bir göstergedir. Odds bir olayın olma olasılığının(P), olmama olasılığı ise (1-P) ya da (q) oranıdır. Odds oranı ise farklı iki grup için hesaplanan odds’un birbirine oranıdır. Etki büyüklüğünün bir ölçüsü olarak kullanılır. Örneğin 100 kadının 70’i sezon sonu indirimlerde alışveriş yapmış, 100 erkekten ise 40 alışveriş yapmış olsun. Birinci grup yani kadınlar için P erkekler içinde q diyelim. Odds oranı aşağıdaki gibi olacaktır.
Kadınların sezon sonu indirimlerde alışveriş yapma ihtimali erkeklere oranla 3.49 daha fazladır. =3.49 =
Lojistik Regresyon Odds Oranı Hesaplama Ürün tattırılan 100 kişiden 68’i ürünü satınalmış, 32kişi almamıştır. Ürün tattırılmadan ürünün satışı durumunda ise 100 kişiden 38’i satınalmış, 62’si satınalmamıştır. Ürün tattırmada satınalanların odds’u = 68/38 = 1.79 Ürün tattırmada satınalmayanların oranı: 32/62 =0.52 Odds oranı= 1.79/0.52 =3.44 Ürün tattırma yapıldığında, yapılmamasına göre tüketicilerin satınalma olasılığı 3.44 kat fazladır. Ürün tattırma Var Yok Satınalma 68 38 106 Satınalmama 32 62 94 Toplam 100 200
KORELASYON ANALİZİ İki değişken arasındaki birlikteliği ve yönü belirlemek için en sık kullanılan istatistik yöntemi, korelasyon analizidir. Korelasyon katsayısı bir oran olup, -1 ile +1 arasında bir değerdir. Katsayı pozitif ise, değişkenlerin biri artarken diğeri de artıyor; negatif ise, değişkenlerin biri artarken diğeri azalıyor demektir
Korelasyon Katsayılarının İlişki dereceleri Korelasyon Katsayısı (%) İlişki Derecesi İlişki yok 01-10 Çok zayıf 11-20 Nisbeten çok zayıf 21-30 Zayıf 31-40 Nisbeten zayıf 41-50 Çok az zayıf 51-60 Çok az güçlü 61-70 Nisbeten güçlü 71-80 Güçlü 81-90 Nisbeten çok güçlü 91-100 Çok güçlü
Reklâm Harcamaları (X) Satış Özendirme Harcamaları (Y) Örnek : 10 firmanın reklâm harcamaları ile satış özendirme giderleri arasında bir paralellik olup olmadığını merak etmiş olalım. Firma Numarası Reklâm Harcamaları (X) Satış Özendirme Harcamaları (Y) 1 7 10 2 8 3 6 4 9 5
x y 7 10 -1 3 -3 1 9 8 6 -2 4 2 5 -12 12 26
Görüldüğü gibi, reklâm harcamaları ile satış özendirme harcamaları arasında nisbeten güçlü (-%68’lik) ve negatif yönde bir ilişki vardır.