Regresyon Örnekleri
Regresyonun amacı elinizdeki deney ölçüm sonuçlarını en iyi temsil edecek eğriyi uydurmaktır. Lineer regresyonla ölçüm sonuçlarına uydurulan doğrunun eğimini ve y eksenini kestiği yer belirlenmektedir. Lineer regresyon denkleminin katsayılarını belirlemek üzere her bir doğru üzerindeki noktanın gerçek ölçüm değerlerinden olan farklarının karesini minimum yapmak gerekecektir. Bu yöntem en küçük kareler yöntemi olarak da bilinmektedir. Lineer doğru uydurma pek çok temel bilimler alanındaki ölçüm sonuçları için uygun değildir Ölçüm sonuçlarının analizinde çok kere lineer regresyon yetersiz kalabilir. Dolayısıyla daha uygun sonuçlar verebilecek olan non-lineer eğriler ile temsil yolu tercih edilmektedir.
Non-lineer regresyon denklemlerini çıkarmak için yine aynı lineer denklemlerde olduğu gibi en küçük kareler yöntemini kullanabiliriz. En küçük kareler yönteminin en genel halini çıkaralım: Elimizde (xo, yo), (x1, y1), …, (xn, yn) şeklinde n+1 adet ölçüm sonucu olduğunu varsayalım. Amacımız bu sonuçları temsil edecek en küçük kareler polinomunun bilinmeyen ai katsayılarını bulmak olacaktır. ym(xi) = ao + a1x + a2x2 +…+ amxm
Eğer polinomun derecesi (m) verilen ölçüm noktası sayısı ile eşit alınırsa, (m = n) en küçük kareler polinomu interpolasyon polinomlarına eşdeğer olacak ve bulunan polinom tüm ölçüm noktalarından geçecektir. Biz ölçüm sonuçlarının hepsinden geçecek bir eğri uydurmak istemediğimiz için (m) değerini (n) değerinden küçük seçmemiz gereklidir. Bu durumda (m < n) olduğunda, polinom ölçüm noktalarından geçmeyecek fakat en yakın geçen polinom bulunacaktır. Bu da en küçük kareler yöntemi ile sağlanır.
Bu problemde verilen her x noktasındaki y ölçüm değeri ile en küçük kareler polinomu ym(x) ile hesaplanan y değeri arasındaki farkların karesinin toplamı minimum yapılmaya çalışılmaktadır. Verilen ölçüm noktaları ve yaklaşık fonksiyon arasındaki farklar ( ) ile tanımlanırsa: = y(x) - y En küçük kareler yönteminin esası, toplam hata miktarını minimuma indirgemek olduğundan hata değerinin ifadesi yazılırsa; i i m i i
Bu hata değeri minumum yapılmaya çalışılır Bu hata değeri minumum yapılmaya çalışılır. Burada yi verilen ölçüm değeri ve ym(xi) en küçük kareler polinomu ile bulunan değerdir. Polinomun ifadesi denklemde yerine konursa; Bu ifade eğri uydurmada yapılan hata miktarını göstermektedir. Hatanın minimum olma koşulu uydurulan polinomun katsayılara göre türevlerinin sıfır olmasıdır.
Bu ifadeleri açık şekilde yazarsak;
Bu ifadeyi düzenlersek aşağıdaki lineer denklem takımı elde edilir:
En küçük kareler metodunun en genel halini çıkarttıktan sonra örnek olarak en basit hal olan m=1 lineer doğru uydurma halini alalım. En küçük kareler polinomun denklemi ym(xi) = ao + a1x şeklinde olacaktır. Bilinmeyen ai katsayılarının çözülmesi için aşağıdaki iki koşul kullanılarak; çözülmesi gereken denklem sistemi aşağıdaki gibi oluşturulur:
Bu denklem takımının çözümü ile hata değerini (E) minimum yapan tek bir set ai katsayı vardır.
Örnek (Lineer regresyon): Aşağıdaki tabloda, yapılan bir deneyde voltaja karşı ölçülen gerilme değerleri verilmiştir. Ölçüm datasına uydurulacak en küçük kareler polinomunu bulalım. Bu örnekte m=1 seçerek en basit hal olan lineer doğru uydurma durumu ele alalım. Voltaj (x) 2.05 3.27 5.10 7.32 9.57 Gerilme (y) 7.65 8.26 8.73 9.42 10.32
Çözüm: m =1 için lineer denklem sistemini yazarsak; n = 4, n+1 =5
Bu değerleri denklem sisteminde yerine koyarak: Bu denklem sisteminin çözülmesi ile ao = 7.02 ve a1 = 0.339 Bulunur. Böylece aranan doğru denklemi Gerilme = 7.02 + 0.34(Voltaj) şeklindedir.
Bu denklem ile bulunan değerleri verilen ölçüm datasıyla kontrol edelim. x : 2.05 3.27 5.10 7.32 9.57 y (ölçüm): 7.65 8.26 8.73 9.42 10.32 y (polinom): 7.71 8.13 8.75 9.50 10.26
Verilen ölçüm noktaları ve uydurulan polinom çizilmiştir.
Genellikle ölçüm datalarınının trendi doğru parçaları ile temsil edilemeye uygun değildir. Bu durumda daha yüksek dereceden non-lineer eğriler uydurmak gerekecektir. Örneğin ikinci dereceden bir eğri uydurmak için aşağıdaki denklem sisteminin çözümü gerekecektir.
Polinomun denklemi y = ao + a1x + a2x2 şeklinde olacaktır. Örnek (Non-lineer regresyon): Aşağıda kuvvete karşı gerilme değerleri görülmektedir. Bu ölçüm noktalarını temsil edecek ikinci derece (m=2) bir polinomu elde edelim . Kuvvet(x) 8 10 12 16 20 30 40 60 100 Gerilme (y) 0.88 1.22 1.64 2.72 3.96 7.66 11.96 21.56 43.16 Çözüm: Polinomun denklemi y = ao + a1x + a2x2 şeklinde olacaktır. n = 8, n+1 =9
i xi yi 8 64 512 4096 0.88 7.04 56.32 1 10 100 1000 10000 1.22 12.20 122.00 2 12 144 1728 20736 1.64 19.68 236.16 3 16 256 65536 2.72 43.52 696.32 4 20 400 8000 160000 3.96 79.20 1584.00 5 30 900 27000 810000 7.66 229.80 6894.00 6 40 1600 64000 2560000 11.96 478.40 19136.00 7 60 3600 216000 12960000 21.56 1293.60 77616.00 1000000 100000000 43.16 4316.00 31600.00 Σ= 296 17064 1322336 116590400 94.76 6479.44 537940.80
Bulunan değerleri lineer denklem takımında yerine konursa; 9ao + 296a1 + 17064a2 = 94.76 296ao + 17064a1 + 1322336a2 = 6479.44 17064ao + 1322336a1 + 116590400a2 = 537940.80 Bu denklem sisteminin çözümü ile ao = -1.91917, a1 = 0.278215 ve a2 = 0.0017394 olarak bulunur. Böylece polinomun denklemi y = -1.92 + 0.28x + 0.0017x2
Aşağıdaki tabloda verilen ve polinom ile hesaplanan değerler kıyaslanmaktadır. x 8 10 12 16 20 30 40 60 100 y (ölçüm) 0.88 1.22 1.64 2.72 3.96 7.66 11.96 21.56 43.16 y (polinom) 0.42 1.04 1.67 2.98 4.34 7.99 11.99 21.04 43.30
Çoklu Regresyon Birçok deneyde ölçülecek fiziksel büyüklüğü etkileyen deney parametrelerinin sayısı birden fazla olabilir. Bu nedenle tek parametreli regresyon yetersiz kalabilir. Birden fazla deney parametresi bulunması durumunda çoklu regresyon yöntemi uygulanmalıdır. Bir otomobilin yakıt sarfiyatı katedilen yolun fonksiyonu olarak ifade edilebilir. Ancak arabanın ağırlığını da dikkate alan bir ifade çok daha doğru olacaktır.
Benzer şekilde bir konteyner gemisinin taşıma kapasitesini sadece boy ile ifade etmeye çalışmak sağlıklı olmayacaktır. Daha gerçekçi bir temsilde geminin genişliği, derinliği ve tekne form narinliği de dikkate alınmalıdır. İki adet bağımsız değişkenin bulunması durumunda çoklu regresyon ifadesi Y= a + b1 X1 + b2 X2 olacaktır. Burada
Y = Ölçülecek büyüklük a = X1 ve X1 sıfır iken ölçülmesi beklenen değer X1 = Birinci bağımsız değişken b1 = X1 bağımsız değişkeninin değişim doğrusunun eğimi X2 = İkinci bağımsız değişken b2 = X2 bağımsız değişkeninin değişim doğrusunun eğimi a ve b katsayıları hata karelerinin toplamı minimum olacak şekilde belirlenecektir
Bu ifadenin a ve b katsayılarına göre türevi alınarak sıfıra eşitlenirse
Bu denklem aşağıdaki gibi matris formuna sokulabilir
Not: Bağımsız değişkenler olarak LBP, B değerleri kullanılacaktır. Örnek (Çoklu regresyon). Aşağıdaki tabloda verilen gemiler için deadweight (DWT), boy (LBP), genişlik (B) ve değerlerini kullanarak çoklu regresyon ifadesini çıkarınız. Not: Bağımsız değişkenler olarak LBP, B değerleri kullanılacaktır. Sıra No DWT LBP (m) B (m) T (m) PB (kW) V (knot) İnşa tarihi 1 11000 124,6 20,8 7,7 8311 17,0 95 2 10950 124,5 7,5 14926 17,3 3 10200 132,0 20,5 7,1 6656 17,1 97 4 12700 135,4 22,9 8,3 7960 16,8 96 5 12600 140,1 22,3 7988 18,3 6 8350 119,0 20,4 6000 17,2 98 7 9000 117,0 20,0 7,3 6300 8 12238 136,0 22,7 11474 19,5 9 10300 7,2 6509 10 16563 152,0 26,2 8,25 12268 19,0 99 11 14357 139,8 23,1 7,4 10400 18,5 12 11116 131,4 22,8 8,7 8400 17,5 13 14300 150,0 25,6 9,2 15105 21,5 00 14 15000 141,2 25,0 9,0 12278 15 12400 6930 18,1 16 14643 151,1 23,5 9,3 10920 19,2 17 13000 135,9 23,3 8,8 10560
y = a + b1 x1 + b2 x2 DWT= a + b1 LBP + b2 B,
n : 17 : 2302.1 : 382.70 : 208717 : 313460.05 : 52092.22 : 28600557 : 8671.61 : 4760415.20
Yukarda hesaplanan değerler aşağıdaki matriste yerine konularak a, b1 , b2 katsayıları bulunur:
Bulunan katsayılar çoklu regresyon ifadesinde yerine konursa; DWT= -15166 + 96.68LBP + 637.49B Bu denklem kullanılarak hesaplanan yeni DWT değerleri aşağıdaki tablonun son kolonunda görülmektedir. DWT LBP (m) B (m) DWTyeni 11000 124,6 20,8 10141 10950 124,5 10131 10200 132,0 20,5 10665 12700 135,4 22,9 12523 12600 140,1 22,3 12595 8350 119,0 20,4 9344 9000 117,0 20,0 8896 12238 136,0 22,7 12454 10300 16563 152,0 26,2 16232 14357 139,8 23,1 13076 11116 131,4 22,8 12072 14300 150,0 25,6 15656 15000 141,2 25,0 14423 12400 14643 151,1 23,5 14424 13000 135,9 23,3 12827
Örnek.(Çoklu Regresyon) Bir geminin yüzdüğü su hattındaki metasantr yarıçapı formülü ile hesaplanır. Burada I su hattı enine atalet momenti ve deplasman hacmidir. Su hattı atalet momenti su hattının geometrik karakteristiklerine bağlıdır. Bir su hattını tanımlayan temel geometrik parametreler şunlardır: L B LCF AWP
I : Su hattı enine atalet momenti (bağımsız değişken) ʃ y dA L : Su hattı boyu (bağımlı değişken) B : Su hattında genişlik (bağımlı değişken) AWP : Su hattı alanı (bağımlı değişken) LCF : Su hattı alan merkezi (bağımlı değişken) Bu durumda atalet momenti için aşağıdaki çoklu regresyon ifadesi yazılabilir. I= a0 + a1 L + a2 B + a3 AWP + a4 LCF a katsayıları hata karelerinin toplamı minimum olacak şekilde belirlenecektir. Bu ifadenin a katsayılarına göre türevi alınarak sıfıra eşitlenirse 2
Bu denklem aşağıdaki gibi matris formuna sokularak a katsayıları çözülerek denklem bulunur:
Aşağıdaki tabloda verilen gemiler için boy, genişlik, su hattı alanı ve su hattı alan merkezi değerlerini kullanarak su hattı atalet momenti için çoklu regresyon ifadesini çıkarınız. I= a0 + a1 L + a2 B + a3 AWP + a4 LCF Gemi LWL (m) B (m) AWP (m2) LCF (m) I(m4) NPL 25.4 4.376 94.171 0.923 122.372 TRAWLER 30.48 6.1 139.93 1.238 331.499 FFG 7 124.36 13.74 1262.751 7.531 14482.940 IACS 160 24.232 2698.592 6.216 98217.54 S175 175 25.5 3153.267 6.916 128259.1 Seri 60 0.6 121.92 16.256 1400.398 4.728 23626.61 Seri 60 0.7 17.418 1671.726 1.991 34957.83 Seri 60 0.8 18.756 1997.708 -0.668 52280.03
NPL L= 25.4 B= 4.376 Sta No y SM Product MC y3 1.703 1 5 8.515 4.939 1.870 4 7.480 29.920 6.539 26.157 2 2.015 4.030 3 12.090 8.181 16.363 2.100 8.400 16.800 9.261 37.044 2.166 4.332 10.162 20.324 2.188 8.752 0.000 10.475 41.899 6 2.145 4.290 -1 -4.290 9.869 19.738 7 2.031 8.124 -2 -16.248 8.378 33.511 8 1.731 3.462 -3 -10.386 5.187 10.373 9 1.170 4.680 -4 -18.720 1.602 6.406 10 0.360 -5 -1.800 0.047 55.613 20.213 216.801 AWP 94.171 LCF 0.923 I 122.372
NPL için uygulayalım 1.000 25.400 4.376 94.171 0.923 a0 122.372 645.160 111.150 2391.952 23.449 a1 3108.256 19.149 412.094 4.040 a2 535.501 8868.243 86.937 a3 11523.964 112.972 a4 14974.980
a0= 23.788 a1= -2.1623 a2= 3.9185 a3= 1.4557 a4= -0.7817 NPL için çoklu regresyon ifadesi I= 23.788-2.1623Li +3.9185Bi+1.4557AWPi-0.7817LCFi I=112.889m4 Tablodan hesaplanan esas değer : Iesas= 122.372m4