OLASILIK ve İSTATİSTİK BÖLÜM 10 KORELASYON ve REGRESYON ANALİZİ Yrd. Doç. Dr. Fatih TOSUNOĞLU
10-KORELASYON ve REGRESYON ANALİZİ Bir değişkenin değerinin diğer değişkendeki veya değişkenlerdeki değişimlere bağlı olarak nasıl etkilendiğinin istatistiksel analizlerle incelenmesi çeşitli nedenlerle istenmektedir: Değişkenler arası ilişkiler bilindiğinde, bir değişkenin değerine bakarak diğerinin değeri tahmin edilebilir Etki eden faktörler kontrol altına alınabilirse ilgilenilen değişkenlerin değerleri optimum (en uygun) düzeye getirilebilir. İki veya daha fazla değişken arasındaki ilişkinin varlığı, bu ilişkinin yönü ve şiddeti korelasyon analizi ile belirlenir.
10-KORELASYON ve REGRESYON ANALİZİ İki değişken arasındaki ilişkinin yönü ve derecesi korelasyon katsayısı ile ifade edilir. Çeşitli korelasyon katsayıları vardır. İncelenen değişken sayısı: İki tane ise korelasyon katsayısı İkiden fazla ise çoklu veya kısmi korelasyon katsayısı Ancak, bu kapsamda iki değişken arasındaki basit doğrusal korelasyon katsayısı üzerinde durulacaktır. Örneğin korelasyon katsayısı r Anakütlenin korelasyon katsayısı ile gösterilmektedir.
10-KORELASYON ve REGRESYON ANALİZİ İncelenen veri grubu koordinat sistemine işaretlenirse değişkenler arasındaki ilişkinin yönü ve derecesi görsel olarak kabaca belirlenebilir.
10-KORELASYON ve REGRESYON ANALİZİ Ancak ilişkinin gerçek düzeyi sadece hesaplama ile belirlenebilir. X ve Y ilgilenilen değişkenleri göstermek üzere korelasyon katsayısının formülü aşağıda verilmiştir Hesaplanan katsayının aldığı değere bağlı olarak, değişkenler arasında; r=-1 ters yönlü mükemmel bir ilişki, r=0 ilişki yok, r=1 aynı yönlü mükemmel bir ilişki, r=0.80 aynı yönlü oldukça iyi bir ilişki, r=-0.60 ters (zıt) yönlü orta derecede bir ilişki olduğu anlamına gelmektedir.
10-KORELASYON ve REGRESYON ANALİZİ KORELASYON KATSAYISININ TESTİ Hesaplanan korelasyon katsayısının anlamlı olup olmadığı aşağıda kurulan hipotez ile belirlenebilir: r’nin ait olduğu anakütlenin varyansı bilinmediği için testte t dağılımından yararlanılır. Öte yandan, korelasyon katsayısının belirli bir değere eşit olup olmadığı aşağıdaki hipotez yardımıyla belirlenebilir.
10-KORELASYON ve REGRESYON ANALİZİ Örnek: Yeni doğan bebeklerin ağırlık (kg) ve beden (göğüs) genişliği (cm) arasındaki ilişkiyi belirlemek için bir araştırma yapılmış ve aşağıdaki sonuçlar elde edilmiştir. Bu sonuçlara göre; a) Korelasyon katsayısını hesaplayarak yorumlayınız. b) =0.01 hata seviyesinde hesaplanan korelasyon katsayısının anlamlı olup olmadığını test ediniz. c) =0.01 hata seviyesinde hesaplanan korelasyon katsayısının 0.80’e eşit olup olmadığını test ediniz
10-KORELASYON ve REGRESYON ANALİZİ Örnek Çözüm: Bebeklerin ağırlıkları ile beden genişlikleri arasında aynı yönlü ve iyi bir ilişki vardır.
10-KORELASYON ve REGRESYON ANALİZİ Örnek Çözüm:
10-KORELASYON ve REGRESYON ANALİZİ Örnek:
10-KORELASYON ve REGRESYON ANALİZİ İncelenen değişkenlerin birinin bağımlı (Y) diğerlerinin bağımsız (X1, X2, X3,...., Xn) olması halinde; bağımlı değişkenin bağımsız değişkenlerin fonksiyonu olarak: Y=f(X1, X2, X3,......, Xn) şeklinde ifade edilmesi regresyon analizinin konusunu oluşturur. İncelenen olayda; bir bağımlı, bir bağımsız değişken varsa oluşturulacak model tek değişkenli regresyon modeli Y=f(X), incelenen olayda bir bağımlı, birden fazla bağımsız değişken varsa oluşturulacak model çok değişkenli regresyon modeli Y=f(X1 , X2 , X3 ,...., Xn) olarak adlandırılır. Ayrıca, regresyon denklemleri doğrusal ve eğrisel olmak üzere iki ayrı şekilde de sınıflandırılmaktadır.
10-KORELASYON ve REGRESYON ANALİZİ TEK DEĞİŞKENLİ DOĞRUSAL REGRESYON MODELİ Regresyon denklemleri oluşturulurken ortalamadan sapma kareler toplamını en küçükleyen ve “en küçük kareler yöntemi” olarak adlandırılan yöntem kullanılır. Genel bir yöntem olan en küçük kareler yöntemi aşağıdaki gibi ifade edilir: Bu ifadenin matematiksel sembollerle gösterimi
10-KORELASYON ve REGRESYON ANALİZİ En küçük Kareler Yöntemi: X ve Y arasındaki ilişki tam ve kusursuz bir ilişki (r=1 veya r=-1) olmadıkça Y’nin X’e göre regresyon doğrusu serpilme diyagramındaki bütün noktalardan geçmez. Bu ilişki kusursuz değilse bazı noktalar için regresyon doğrusundan sapmalar görülebilir. Bu doğruların bazılarında gözlenen sapmalar diğerlerine göre daha çok (veya daha az) olabilir. Enküçük kareler yöntemi, gözlenen bu sapmaları en küçükleyen doğruyu belirlemekte kullanılır.
10-KORELASYON ve REGRESYON ANALİZİ En küçük Kareler Yöntemi:
10-KORELASYON ve REGRESYON ANALİZİ Tek değişkenli doğrusal regresyon denkleminin genel yazılışı: Tek değişkenli doğrusal regresyon denkleminde iki bilinmeyen katsayı vardır.
10-KORELASYON ve REGRESYON ANALİZİ iki katsayıyı belirleyebilmek için hata terimi aşağıdaki gibi yazılır ve en küçük kareler yöntemine göre hata kareleri toplamı alınırsa: Hata kareleri toplamı eşitliğinin sağ tarafındaki ifadenin değeri bilinmeyen a ve b katsayılarına göre kısmi türevleri alınırsa Bu denklemlere normalin denklemleri denir. Elde edilen iki denklem çözülerek a ve b katsayılarının belirlenir.
10-KORELASYON ve REGRESYON ANALİZİ Oluşturulan regresyon denkleminin ne derece iyi bir tahminleyici olduğunu belirleyen oran belirlilik katsayısı olarak ifade edilir ve R2 ile gösterilir Belirlilik katsayısı aralığında değer alabilir. R2 değeri 1’e ne derece yakın ise denklem o derece iyi, sıfıra ne derece yakın ise denklem o derece kötü bir tahminleyici olarak kabul edilir.
10-KORELASYON ve REGRESYON ANALİZİ REGRESYON KATSAYISININ TESTİ Belirlenen regresyon katsayıları anlamlı ise oluşturulan regresyon denklemi tahmin amacıyla kullanılabilir. Oluşturulan regresyon denkleminin katsayılarının anlamlı olup olmadıkları aşağıdaki hipotez ile belirlenebilir:
10-KORELASYON ve REGRESYON ANALİZİ Oluşturulan tek değişkenli doğrusal regresyon denkleminde önemli ve çok etkin olan katsayı b katsayısıdır. O nedenle, sadece b katsayısının anlamlı olup olmadığının test edilmesi yeterlidir. Ayrıca, oluşturulan regresyon denkleminde bağımsız değişkenin çarpanı durumunda olan ve doğrunun eğimini gösteren b katsayısının denklem üzerindeki etkisi dikkate alınarak, b katsayısı için güven aralığı oluşturulmaktadır. b katsayısı için hata seviyesindeki güven aralığı t dağılım kullanılarak:
10-KORELASYON ve REGRESYON ANALİZİ Örnek: Belirli bir ağırlık taşıyan bir plastik malzemenin verilen sıcaklıklar altında uğradığı şekil değişimleri Tabloda verilmiştir. En küçük kareler yöntemini kullanarak regresyon denklemini oluşturunuz. Regresyon katsayısının anlamlı olup olmadığını test ediniz (=0.01). 80 0C sıcaklıkta şekil değişimini belirleyiniz Belirlilik katsayısını hesaplayarak yorumlayınız.
10-KORELASYON ve REGRESYON ANALİZİ Bu ifadeleri elde etmek için Tablo kullanılabilir:
10-KORELASYON ve REGRESYON ANALİZİ
10-KORELASYON ve REGRESYON ANALİZİ
10-KORELASYON ve REGRESYON ANALİZİ Regresyon katsayısının anlamlı olup olmadığının testi (=0.01) I) II) III) Test istatistiği:
10-KORELASYON ve REGRESYON ANALİZİ IV) 80 0C sıcaklıkta şekil değişimini Belirlilik katsayısı
10-KORELASYON ve REGRESYON ANALİZİ Kaynaklar 1- İstatistik ve Olasılık Ders Notları-Prof. Dr. Cafer ÇELİK 2-İstatistiğe Giriş- Prof. Dr. Necati YILDIZ 3- İstatistik Analiz Metotları- Prof. Dr. Bilge ALOBA KÖKSAL 4- Mühendisler için İstatistik- Prof. Dr. Mehmetçik BAYAZIT