Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Korelasyon (Bağıntı) Parametre Tayini, Karelerin En Küçüğü Yöntemi.

Benzer bir sunumlar


... konulu sunumlar: "Korelasyon (Bağıntı) Parametre Tayini, Karelerin En Küçüğü Yöntemi."— Sunum transkripti:

1 Korelasyon (Bağıntı) Parametre Tayini, Karelerin En Küçüğü Yöntemi

2 Korelasyon Katsayısı  Değişkenler arasındaki ilişkinin kuvvetini nicelendirmek üzere kullanılan istatistik: KORELASYON KATSAYISI  Dikkat: Neden sonuç ilişkisiyle karıştırmayın. X artarken Y artıyorsa bu x’deki artış y’de artışa neden oluyor demek değildir.

3 Kovaryans  İki değişken arasındaki doğrusal (lineer) bağımlılığın ölçüsü x ile y arasındaki kovaryansdır.  Eğer x ve y bağımsızsa cov(x,y) = 0  Eğer cov(x,y) = 0 ise bu x ve y’nin bağımsız olduğuna veyax ve y arasında lineer olmayan bir bağıntı olduğuna işarettir.  Excel’de cov(x,y) = kovaryans(dizi1;dizi2) fonksiyonu ile hesaplanabilir. Yığındaki birim sayısı X ve Y için yığın ortalamaları

4 Korelasyon (Bağıntı) Katsayısı  Kovaryans değişkenlerin birimine bağlı olduğundan büyük ya da küçük olması ilişkinin kuvvetli veya zayıf olması hakkında bir fikir vermez.  Birimsiz kovaryans = Korelasyon katsayısı  Birimsiz hale getirmek için kovaryans x ve y’nin standard sapmasına bölünür. p = [-1,1]

5 Bağıntı Katsayısı  0

p = Negatif bağıntı p = [-1,1] y x y x

6 Örneklemlere Ait Bağıntı Katsayısı X örnekleminin standard sapması Y örnekleminin standard sapması Excel’de korelasyon katsayısı = korelasyon(dizi1;dizi2) fonksiyonu kullanılarak hesaplanır.

7 Örnek  İki farklı kişi tarafından yapılan BOİ ölçümleri verilmiştir. Ölçümler arasındaki bağıntıyı değerlendirin.

8 Bağıntı Katsayısı r = 0.93  r değerleri değişkenler arasında lineer bir ilişki varsa anlamlıdır. Eğer iki değişken arasında y =a + bx + cx 2 gibi bir ilişki varsa r ±1 ‘ e yaklaşmaz.  Grafiksel gösterim ilişkinin nasıl olduğunu göstermesi açısından önemlidir.  Ne kadar kuvvetli olursa olsun bağıntı nedensellik demek değildir.

9 Korelasyon ve Regresyon  Korelasyonda iki bağımsız değişken sözkonusudur. Regreseyondaysa iki değişken belirli roller üstlenir.  x: bağımsız  y: bağımlı değişken olarak ele alınır.  Regresyon çözümlemesi sadece y’nin ölçüm hatalarından etkilendiğini varsayar. Eğer x’deki hatalar küçükse (s x < s y /3) sonuçlar yararlıdır.

10 Bağıntı Katsayısının Değerlendirilmesi  Bağıntının anlamlı olup olmadığı gözlem sayısına bağlı olarak değişebilir ve kritik r değerleri tablosundan değerlendirilebilir.

11 Bağıntı Katsayısının Değerlendirilmesi df = v = Gözlem sayısı -2

12 Bağıntı Katsayısının Değerlendirilmesi  Genelde bağıntının kuvveti için: çok az ya da hiç zayıf orta orta kuvvette çok kuvvetli

13 Serisel İlgileşim  Eğer eldeki veri sıralı olarak toplanmışsa, yere veya zamana bağlı olarak birbirine yakın olanlar birbirine daha yakın değerler taşır. Diyelim ki bugün havadaki SO 2 konsantrasyonu 150  g/m 3 ise durgun hava şartlarında ertesi gün için buna yakın bir değer bekleriz. Dünden kalan SO 2 hala etkisini sürdürecektir.  Bu şekilde birbirine yakın zamanda veya konumda alınan verilerin benzer olması durumuna serisel bağlılık veya otokorelasyon denir. Serisel bağlılığın nicel ölçütü otokorelasyon katsayısıdır.

14 Oto Korelasyon Katsayısı  Oto korelasyon bir değişkenin kendi içindeki ilgileşimdir.  Eğer günlük ölçümler yapıldıysa y t ’ye karşılık y t-7 serisel haftalı bir bağlantıya işaret eder. İlgileşim için incelenen gözlemler arasındaki uzaklık lag ile ifade edilir. Bu uzaklık örnek alma aralıkları ile ölçülür. y t+1 ytyt

15 Oto-Korelasyon Katsayısı,r k r k [-1, 1] k = 1,2 veya uygun bir sayı r k = 1 (mükemmel pozitif korelasyon

16 BOİ Verisi Her iki saatte bir 10 gün süreyle alınan BOİ verisi. Oto korelasyon hakkında ne söylenebilir?

17 r k = 0.45 k = 1 k = 3 (3 lag, 6. saat) -  r k = 0.03 k = 6 (6 lag, 12 saat)  r k = k = 12 (12 lag, 24 saat)  r k = 0. 25

18  İlk 24 saatlik örüntü ikinci 24 saatlik kısımda tekrar ediyor ama korelasyonun kuvveti azalıyor.  Örneklem arasındaki zaman farkı yüzünden diğer faktörlerin değişimiyle sistemin hafızası kısalıyor.

19 Karelerin En Küçüğü Yöntemiyle Parametre Tahmini (Regresyon)  İstatistikte en çok karşılaşılan sorulardan biri eldeki veriye bir eşitliğin uydurulmasıdır.  Neden veriye bir eğilim çizgisi ekleme ihtiyacı duyuluyor?  y’yi bağlı olduğu değişkenlere göre ilerde tahmin etmek istiyoruz  x’deki değişkenliğin y’yi nasıl etkileyeceğini ve böylece sistemi ve onu daha iyi sonuçlar verecek şekilde değiştirmek istiyoruz.

20  Veriye uydurulan eşitlik  1. Görgül deneysel (Emprikal) –tanımlayıcı  2. Mekanistik: sistemin nasıl işlediğine dair temel süreçlere dayanarak Bağımlı değişken (y) bağımsız değişken (x’in) birkaç değerinde ölçülür. X aynı zamanda girdi değişkeni,regresör, tahmin edici değiken olarak da tanımlanır. Regresyon: Bir denklemi veriye uydurma işlemidir. Bazen de eğilim çizgisi uydurma veya parametre tayini de denir.

21  Lineer Regresyon: Etkiler nedenlerle orantılı. Örnek: F = ma F  a  Lineer olmayan Regresyon: etkiler nedenlerle doğrudan orantılı değil. Örnek: Hareket eden bir objenin üzerindeki hava akımının kuvveti hızın karesiyle orantılıdır: F  v 2 Sistemde daha fazla fiziksel özelliği hesaba kattıkça sistem lineer olmaktan uzaklaşır

22 Regresyon Modeli  (yi,xi)  Y=f(x) Lineer regresyonda x ve y’ler ölçülerek  ve  parametrelerinin değerlerini bulmak. Eğer kullanılan eşitlik lineer değilse lineer olmayan regresyon kullanılır veya lineer formata dönüşüm sağlanıyorsa dönüştürme yapılır. x b = y bLogx = logy bx’=y’

23  Doğrusal ve doğrusal olmayan arasında farkı belirtmek üzere  Doğrusal:  Doğrusal Olmayan X: bağımsız değişkenlerden oluşan vektör B: modelin parametreleri  =[  1,  2,  3 ] Parametrelerin tahmin edilen değerleri ise b 1, b 2, b 3 ile gösterilir.  = k = [k1,k2,k3] ile gösterilir.

24  İyi planlanmış bir deney için x i değerlerinin hatasız, y i değerlerinin de rastsal hatalardan etkilendiği varsayılır.  y i = m i + e i i = 1,2,3,….n  Eğer model doğruysa e i rastsal hatalardan daha büyük olmayacaktır. Eğer değilse, e = rastsal hatalar + model hataları (modelin oluşturulmasında dikkate alınmamış kayıp terimler) e = rastsal hatalar + model hataları (modelin oluşturulmasında dikkate alınmamış kayıp terimler) Modeli veriye uydurduktan sonra ölçülen değerler ile modellenen değerler arasındaki fark (e i ) rassal ve bağımsızsa modelin veriye uyduğunu söyleyebiliriz. Eğer kalanlar bir örüntü gösteriyorsa, bu bize modeli hangi yönde geliştireceğimizi gösterir.

25 Basit Doğrusal Model  y i =  0 +  1 x i + e i  Kalanlar = e i = y i -(  0 +  1 x i )  Regresyon gözlemlenen veriye “en iyi” uyan eğrinin parametrelerini seçmemizi sağlar.  NASIL ? Karelerin En Küçüğü Yöntemi ei Ölçüm değerleri Model değerleri  =  0 +  1 x

26 1. Karelerin En Küçüğü Yöntemi ile Parametre Tayini  Model ile gözlemler arasındaki farkları en aza indirmek Modelden hesaplanan değerler Gözlemlenen değerler

27 Örnek Doğrusal Model  y =  x Eğer uydurulacak eşitlikte iki parametre varsa, iki tane normal denklem olur. Parametre sayısı arttıkça lineer regresyon hesaplamalarında cebirsel matrisler kullanılarak çözüme ulaşılır.

28 Doğrusal Olmayan Modeller   = exp(-  x) Cebirsel yolla çözülemez. Bu durumda iteratif (yinelemeli) yöntemler kullanılır. Öyle bir  değeri bulunacak ki S(  ) en az değere düşecek.

29 2. Yinelemeli Yöntemle Parametre Tayini Yandaki veri seti için yinelemeli yöntemle doğrusal model parametrelerini belirleyin. y = bx Yinelemeli yöntemde b parametresi için bir ilk değer verilir. Model ile y değerleri hesaplanır. Modellenen y ile gözlenen y’ler arasındaki farkların karesi hesaplanır. Bir sonraki b ile işlem tekrarlanır. Karelerin farkının en küçük değerine karşılık gelen b bulunduğunda parametre tayini işlemi sonlanmış olur.

30 Doğrusal Model, y =  x 1. Yineleme:  = 0.115

31 Doğrusal Model, y =  x 1. Yineleme:  = 0.14

32 Doğrusal Model, y =  x 1. Yineleme:  = 0.10

33 En Küçük Kareler Tahmini Kareler Toplamının Kalanı Tek değişkenli doğrusal bir model için kalanların kareleri her zaman için bir parabol verir. Parabol olduğuna göre bir doğrusal model için karelerin en küçüğüne denk gelen parametre değerini nasıl bulabiliriz?

34 Doğrusal Olmayan Modelde Parametre Tayini Yandaki veri seti için yinelemeli yöntemle doğrusal olmayan model parametrelerini belirleyin. y = exp(-  x) Yinelemeli yöntemde b parametresi için bir ilk değer verilir. Model ile y değerleri hesaplanır. Modellenen y ile gözlenen y’ler arasındaki farkların karesi hesaplanır. Bir sonraki b ile işlem tekrarlanır. Karelerin farkının en küçük değerine karşılık gelen b bulunduğunda parametre tayini işlemi sonlanmış olur.

35 Doğrusal Olmayan Model, y = exp  x) Min S(  ) = Σ[y i -exp(-  x i )] 2 1. Yineleme:  = 0.32

36 Doğrusal Olmayan Model, y = exp  x) 2. Yineleme:  = 0.15

37 Doğrusal Olmayan Model, y = exp  x) 3. Yineleme:  = 0.20 (optimum)

38 En Küçük Kareler Tahmini Kareler Toplamının Kalanı Lineer olmayan modeller için kalanların kareleri parabol değildir ve genelde simetrik olmazlar. 

39 Parametrelerin Hassasiyeti  Parametrelerin en iyi değerlerini hesaplamak için parametrelerin hassasiyetinin bilinmesi gerekir.  Tek parametreli doğrusal model için var(b) =  2 /  x i 2  2 deneysel hata varyansıdır. İdealde  2, x’in belli bir değeri için tekrar deneyleri yaparak hesaplanabilir. Ancak bu örnekte ve gerçekte yapılan bir çok deneyde tekrar gözlem mevcut değildir. Bu durumdan  2 kalanların karelerinin toplamından (S R ) tahmin edilir. Eğer model doğruysa kalanlar rastsal hatalardan oluşur ve kalanlarını karelerinin ortalaması  2 ’yi verir.

40 Doğrusal Modelde b’nin Hassasiyeti  s 2 = S R /v v: serbestlik derecesi =n-p n: gözlem sayısı p: parametre sayısı Doğrusal model için S R = s 2 = /(6-1) = var(b) = s 2 /  x i 2 = /713 =3.25x10 -4 SE(b) : b’nin standard hatası = karekök(3.25x10 -4 ) = b ± SE(b) = 0.10 ±

41 b’nin hassasiyeti  b’nin hassasiyeti b ± SE(b) = 0.10 ± şeklinde ifade edilebileceği gibi diğer bir yol da güvenilirlik aralığını belirtmek olabilir.  Güvenilirlik aralığı: b ± t v=5,  SE(b)  %95 güven aralığı için: t = 2.57  0.1 ± (2.57)(0.0018) = 0.1 ± = b = [0.095,0.105]


"Korelasyon (Bağıntı) Parametre Tayini, Karelerin En Küçüğü Yöntemi." indir ppt

Benzer bir sunumlar


Google Reklamları