Gazi Üniversitesi Kimya Mühendisliği KM 380 KİMYA MÜHENDİSLİĞİ LABORATUVARI I VERİ ANALİZİ DERSİ Doç.Dr. N. Alper TAPAN
VERİ ANALİZİ 1)HATA TİPLERİ 2)HATA İFADELERİ 3)HATANIN SONUCA YANSITILMASI 4)ANLAMLI BASAMAKLAR 5)VERİ KALİTESİ KRİTERLERİ 6)DENEYSEL VERİLERİN İSTATİSTİKİ ANALİZİ
1)HATA TİPLERİ(belirsizlik,ölçülmüş değer-gerçek değer) Sistematik(determinate) Hata Cihazdan okuduğumuz değerle gerçek değer arasındaki farktır. Enstrumental hata, operasyon hatası, kişisel hata, metodik hata *Doğruluk derecesi Önlem: kalibrasyon eğrileri Rastgele(Random,determinate Hata(insignificant error) Noise, subjektif okuma hatası Noise: Okuma değerlerinde cihaza bağlı dalgalanmalar. Aynı şartlar Altında yapıldığında farklılıklar Göstermesi, deney şartlarındaki (T,C, P) dalgalanmalar. *Kesinlik derecesi Tamamen yok edilemezler.
SİSTEMATİK HATA: Sistematik hatada hatanın eksi ya da artı işaretli olduğu bilinir Eğer sistematik hata bilinmiyorsa ya da hata değerinin İşaretinden emin olunamıyorsa parametrenin alabileceği Değerler aralığı belirlenir. RASTGELE HATA: Eğer hatanın gerçek değeri bilinmiyorsa, sistematik hatayı Belirleyemeyiz, bunun yerine her deneysel değişken için Alabileceği değer aralığını belirlemek için standart sapmasını Ya da GÜVEN ARALIĞINI tespit ederiz.
2)HATA İFADELERİ Mutlak Hata Kalibrasyon eğrisinde okunan değer aralığıdır. E=Xm-Xt = 0.04 Bağıl Hata Hatanın büyüklüğünün veriye oranıdır 0.02ml 0.02/12.35=0.002 %0.2 *Bir ölçümün doğruluğu bağıl yada mutlak hata olarak Gösterilir. *Error= Xi-Xort
3)HATANIN SONUCA YANSITILMASI 3.A) SİSTEMATİK HATANIN SONUCA YANSITILMASI Eğer bir değişkenin sistematik hatasının değeri ve işareti Biliniyorsa aşşağıdaki denkliğe göre sonucun sistematik Hatası bulunabilir. (F)=( F/ x). (x)+( F/ y). (y) +( F/ z). (z)+ ….. F=(x. y)/z (F)/F= (x)/x+ (y)/y + (z)/z
3) HATANIN SONUCA YANSITILMASI 2 (F)=( F/ x) 2. 2 (x)+( F/ y) 2. 2 (y) +( F/ z) 2. 2 (z)+ ….. F= bağımlı değişken, x, y, z.... =Bağımsız değişkenler Bu genel denkliğe göre istediğiniz karmaşık işlemlerin rastgele Hatasını bulabilirsiniz. Örneğin: F=C.x 2 /y Bu eşitliğe genel denkliği uygulayalım 2 (F)=(2.C.x/y) 2. 2 (x)+(C.x 2 /y 2 ) 2. 2 (y) böylece işlem Sonucu için rastgele hatayı ifade etmiş olduk eğer denkliği F 2 ye bölersek sadeleşmiş sonuç 2 (F)/F 2 =(4. 2 (x)/x 2 )+( 2 (y)/y 2 ) (F)=(((4. 2 (x)/x 2 )+( 2 (y)/y 2 )).F 2 ) B) RASTGELE HATANIN SONUCA YANSITILMASI Standart sapma, güven aralığı, belirsizliğin sonuca yansıtılması
4)ANLAMLI BASAMAKLAR(SIGNIFıCANT FIQURES) Sayısal bir değeri tam doğruluk ve hassasiyette belirten basamaklara anlamlı basamaklar denir ve 6,784 sayılarındaki anlamlı basamak sayısı dörttür. 0, ve sayılarının anlamlı basamak sayısı da dörttür. 6 dan önce gelen sıfırların ya da 1 den sonra gelen sıfırların hassasiyetle bir ilgisi yoktur 3.46, Eğer en sondaki sayı 5 ise ve ondan sonra gelen basamaklar sıfırdan farklı değilse 73.14, 48.72
Toplama:Toplamın hassasiyeti en düşük anlamlı basamağa Göre alınır = 46.3 Çıkarma: Farkı alınan iki sayının hassasiyetinden sonucun Hassasiyeti daha düşük olur – (bağıl hassasiyet =1/67000) = 0.52 (bağıl hassasiyet %2) Sonucun bağıl hassasiyeti diğer sayılardan daha düşük Olmalıdır. Çarpma/bölme:Sonucun bağıl hassasiyeti işlemdeki en düşük Hassasiyete sahip sayının hassasiyetinden daha yüksek olamaz. Sonucun anlamlı basamak sayısı işlemdeki en düşük anlamlı Basamak sayısına göre olur. 346*121(1/121=%0,8)*900,0 = 3,77*10 7 (1/377,%0.27) - 3,8*10 7 (1/38=%2.6) OK
5)VERİ KALİTESİ KRİTERLERİ KESİNLİK(Reproducibilty) Sonucun tekrarlanabilirliğinin ölçüsüdür. Aynı deney sonucunu ne kadar çok bulabiliriz sorusuna yanıt. Doğruluk(Certainity) Ölçülen değerin gerçek değere Ne kadar yakın olduğunu gösterir. Bir ideal işlem hem kesinlik hemde doğruluk ölçütlerini sağlar. *Gerçek değere yakınlık Deney sayısıÖlçülen değer 1X1 2X2 3X3 4X4 5X5 6X6 7X7 8X8 NXn X1=X2....=Xn sapma=kesinlik Ortalamadan sapma Her kesin doğru olmayabilir.
6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ İstatistik deneysel sonuçlarla nasıl ilgileneceğimizi gösterir. İstatistik analizi bir çok deneye bağlı gözlemlerden elde edilen tekil sonuçlar bütünüdür. -Deneylerin tekrarı N=m n N=deney sayısı m:deneysel seviye sayısı n=parametre sayısı Ör. Reaksiyon hızını bulmaya çalışıyoruz r=f(C,T), dört farklı konsantrasyonda ve sıcaklıkta deneyler Yapılacak ise o zaman N=4 2 =16 deney yapmak gerekir.
6.A) Sonuçların merkezi eğliminin değerlendirilmesi 6A.1)Ortalama Deneysel gözlem sayısı(frekansların toplamı) fi= ölçülen her bir değerin frekansı Ölçümler merkez nokta etrafında simetrik olarak dağılım göstermiş ise kullanılır. En stabil olan merkezi eğilimin hesabıdır. stardart sapma, corelasyon katsayısı hesabında kullanılır. 6A.2)Mode 6A.3)Medyan *Ölçülen değerler içinde en fazla tekrar edeni *Yaklaşık bir istatiki değerdir, kimyasal hesaplamalar için tercih edilmez, *Verilere çabuk göz gezdirilerek bulunabilen yaklaşık bir değerdir. * Frekans dağılımı eğer simetrik ise gerçek mode: mode=3.median-2.mean *Grup edilmemiş verilerin, grup edildikten sonraki ortadaki değeridir.(küçükten büyüğe) 5,5.3,6.4, 7.0,7.2,7.4,7.9,8.1,8.2 N=9, (N+1)/2=5 Median=7.2
6.B) Merkezi eğliminden sapma Standard Sapma Deneysel verilerin ortalama Etrafında hangi yakınlıkta Kümelendiğini gösterir.Kesinlik. Küçük standard sapmaya sahip veriler grubu büyük standard Sapmaya sahip veri grubundan daha düzgündür. Range(Aralık) En yüksek ve en alçak değerler arasındaki fark. *çok uç veriler var ise iyi bir Yöntem değildir. Ortalama Sapma Veri serisi içinde herbir farklı ölçümün ortalamadan sapmasını gösterir. N<30 N>30 -Standard sapma deneysel verilerde en Yüksek stabilite arandığında hesaplanır. -Korelasyon katsayısı gibi istatistiki verilerin Hesabında kullanılır. 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
Standard Sapma İki set deney yapılmış ise bu iki set deney için toplam dağılımın standard Sapması hesaplanır. Pooled standard deviation k= set sayisi Varyasyon Katsayısı *Ortalamalar farklı olduğunda ve ölçüm birimleri farklı olduğundaki etkiyi görmek için değişkenlikler birbiriyle karşılaştırılır. *Farklı durumlarda veri setinin değişimini inceler 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
6.C)Gauss Eğrisi (Bell or Gaussian curve) Deneysel veri grubundaki değişim tamamen rastgele olduğu zaman Dağılım gauss veya normal hata eğrisi olarak gösterilir. -Deney sayısı=665 -s1<s2 -n X ORT => , S=> -n-1= serbestlik derecesi -S 2 =varyans (verilerin dağılımı) s1 s2 Eğer gözlem sayısı oldukça fazla ise (n 50) dağılım eğrisinin normal hata eğrisi olması için ARALIĞI VERİLERİN 2/3’ÜNÜ ARALIĞI VERİLERİN 19/20’SINI ARALIĞI VERİLERİN 97/100’ÜNÜ İÇERİR 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
6.D)Serbestlik derecesi ve güven aralıkları Yapılan sınırlı sayıdaki deneysel gözlem sonucunda elde edilen Değerler (n-1) denilen serbestlik derecesine ve verilerin gerçek Ortalama değer etrafında ne kadar dağıldığına bağlıdır. Dağılımı belirlemek için belirlenen sınırlar arasına gerçek değerin Düşme olasılığına bakılır. Buna güven aralığı denir. Örneğin 95 %lik Güven aralığı belirlersek. Gerçek değerin yapılan deneylerin % 95’inde Bu aralık içine düşebileceğini söyleyebiliriz. %5 yanlış varsayım yapma Olasılığı vardır. LİMİTLER => t: sabit --- tablo 1 : risk faktörü (1-güven seviyesi) 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
6.E)Kötü verilerin atılması Veri grubuna uymadığından şüphelendiğimiz veriyi atıp Atmayacağımıza Q-test metodu kullanarak karar verebiliriz. Örnek: 12.53, 12.56, 12.47, 12.67, sonuçları içinde % güven seviyesi için kötü bir sonuç mudur? 12.47, 12.48, 12.53, 12.56, ara = 0.11 Aralık = 0.20 Q = ara / aralık = 0.55 < Q (tablo 2) (şüpheli değer kalabilir.) Eğer Q (gözlenen) > Q (tablo 2) ise şüphelendiğimiz değeri %90 güvenle atabiliriz 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
Verilerin Atılması için Q değerleri Tablo 2. deneysayısıQ%90Q%96Q% )DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
6.H)En küçük kareler metodu Deneyde gözlemlenen bağımlı (y1....yn) ve bağımsız (x1.....xn) veri Grupları arasındaki lineer ilişkiyi bulabilmek için bu metod uygulanır. 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
6.I)Korelasyon katsayısı Fit edilen doğrunun verileri ne kadar iyi yansıttığını anlamak için Korelasyon katsayısı kullanılır. 0 < r 2 < 1 r 1 e yaklaşmalı y i ölçülen değer, Eğer ölçülen r değeri 0.95 den küçük ise korelasyonun test edilmesi Gerekir. 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ model
6.J)R-test ve F-test metodu 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
F-Distribution Tablo 4 6)DENEYSEL VERİLERİN İSTATİKSEL ANALİZİ
KAYNAKLAR Harris, D.C., “Analytical Chemistry”, W.H. Freeman and Company, 42, Kreyzig, E., “Advanced Engineering Mathematics”, 8 th edition, John Wiley and Sons Inc., 914, Bennett, C.A., Franklin, N.L., “Statistical Analysis in Chemistry and the Chemical Industry”, John Wiley and Sons Inc., Mickley, H.S., Sherwood, T.K., and Reed, C.E., “Applied Mathematics in Chemical Engineering”, McGraw-Hill, Reilly, P.M., “A Statistical Look at Significant Figures”, Chemical Engineering Education”, summer issue, ,1992. Schwatz, L.M., “Propagation of Significant Figures”, Journal of Chemical Engineering Education., 62(8), 693, Garland, C.W., Nibler, J.W., “Experiments in Physical Chemistry”,7 th edition, McGraw-Hill, 2003 Usanmaz, A., “Quantitative Analytical Chemistry”, Middle East Technical University, 1991.