Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Veriyi Dönüştürme, Belirleme Limiti

Benzer bir sunumlar


... konulu sunumlar: "Veriyi Dönüştürme, Belirleme Limiti"— Sunum transkripti:

1 Veriyi Dönüştürme, Belirleme Limiti

2 Veri Dönüştürme Verinin orijinal birimi yerine aşağıdaki dönüşümler kullanılarak verinin daha kolay incelenmesi sağlanır. Log(Y) Karekök(y) 1/y Ya da y’nin diğer bir fonksiyonu Örneğin pH için –log([H+]) kullanılır. Niçin? Bakterilerle ilgili araştırmalarda ise bakteri sayısı N yerine logN kullanılır. Neden?

3 Neden Dönüşümler Kullanılıyor?
1. İki değişkeni arasında düz doğrusal bir ilişki elde etmek için (Daha basit model kullanmak üzere) 1200 1000 800 600 400 100 10000 1000 100 10 MPN t t

4 Neden Dönüşümler Kullanılıyor?
2.Orijinal verinin değişken varyansa sahip olması. Regresyon kullanarak veriye eğilimi çizgisi uydururken bu varyans değişikliği sorun yaratır. Dy = veri değeri-model değer Doğruya en uzaktaki noktaların güçlü bir etkisi olur, çünkü regresyon bu mesafeyi en aza indirmek ister. Sonuçta doğrunun oluşmasında hassasiyetle ölçülmüş 1. noktadaki veri, t=3’te ölçülmüş veriden daha az etkili olur. Oysaki her ver noktasının eşit ağırlıkta olması tercih edilir. Yandaki örnekte log dönüşümü her veri noktası için değişken olmayan bir varyans(değişke) sağlar. x t

5 Dönüştürme ile her veri doğrunun yerini belirlenmesinde hemen hemen eşit bir etkiye sahip olur. Logaritmik dönüşüm bu eşit ağırlığı sağlamak için kullanılır. x logx t t

6 Önemli Hususlar Bazen dönüşüm iyi bir durumu kötü bir duruma dönüştürebilir. Orijinal verideki sabit varyans dönüşüm sonrası değişken bir hale gelebilir. Bu durumda veriniz lineer hale gelmiş olabilir ancak dönüşüm yararlı olmaz. Y1/y dönüşümü özellikle varyansı kötü etkiler. Kullanılmadan önce mutlaka kontrol edilmelidir.

7 Önemli Hususlar Bazen ölçümler yedekli yapılmaz. Sadece tek ölçüm yapılır. Bu durumda varyansın dönüşümden nasıl etkilendiği bilinemez. Bu nedenle her zaman tekrar ölçümler yapmak iyi bir deney stratejisi için kaçınılmazdır.

8 Varyans Sabitleme Dönüşümleri
Yapılan deneyde ölçülen parametrenin değerleri aralığında varyansın değişken olması: Ölçümlerin seyreltme ya da çoklu hataları artırıcı aşamalardan oluşması (Ekstraksiyon) Log ölçekte okuyan bir alet kullanmak Biyolojik sayımlar

9 Tablo 7.1 Durum y yerine kullanılan Not s a y2 s a y3/2
s a y (s2>y) s a y1/2 1/y 1/√y Log(y) , log(y+c) √y (√y +c) Bazı y>0 s2>y arcsin√p p = oran ya da yüzde

10 Karekök ve logaritmik dönüşümlerde büyük değerler küçüklere oranla daha az önemli hale gelir.
0, 1, 4 (4’ün önemi baskın) √y dönüşümü ile 0,1,2’ye dönüşür. Son terimin baskın rolü azalır.

11 Örnek 5 istasyondan toplanan (Tablo 7.2) plankton eş ölçüm numunelerinin ortalamaları ve varyansları tablo B’de verilmiştir. Varyansın sabit olmadığı gözlemlenmiştir. Ortalama değeri (y) arttıkça varyans (s2) orantılı olarak artmaktadır. Bu veri için uygun dönüşüm hangisidir?

12 Örnek,Çözüm s TABLO B İstasyon 1 2 3 4 5 Orijinal Veri y s2 y0.5 0.85
0.77 0.92 0.88 2.05 1.84 1.43 1.36 3.90 3.67 1.97 1.92 4.60 4.78 2.14 2.19 9.25 7.57 3.04 2.75 Yandaki şekilden görüldüğü gibi s a y1/2 olduğundan Tablo 7.1’e göre karekök dönüşümü uygundur. c = 0.5 y = Karekök(y+0.5)

13 Örnek,Çözüm Tablo 7.1’e göre karekök dönüşümünün uygun olduğunu gösterir. c = 0.5 y = Karekök(y+0.5) TABLO B İstasyon 1 2 3 4 5 Orijinal Veri y s2y 0.85 0.77 2.05 1.84 3.90 3.67 4.60 4.78 9.25 7.57 Dönüştürülmüş Veri x s2x 1.10 0.14 1.54 0.19 0.21 2.21 0.24 3.09 0.20

14 Güvenilirlik Aralığı ve Dönüşümler
Örnek: 5 gözlemden oluşan bir örneklemin [95, 20, 74, 195, 71] ortalaması 91, varyansı 4140’dır. Hangi dönüşüm kullanılmalıdır? Çözüm: s2>y. Log dönüş uygulanabilir. x = logy, [ ,1.869,2.290, 1.851]. xort=1.86,s2x=0.128 v=5-1 =4, a =0.05/2 = 0.025 t(4,0.025) = 2.776 %95 lik güvenilirlik aralığı= < mx <2.301 x’i orijinal ölçeğine dönüştürerek y’nin geometrik ortalamasını elde ederiz. yg = antilog( ) = 72.09 25.94< my< (asimetrik)

15 Örnek < mx <2.301 25.94< my< (asimetrik) Nasıl sunmalı? Dönüştürülmüş birimde standart hata ve güvenilirlik aralığını, artı orijinal birimdeki artimetik ve geometrik ortalamayı. Böylece okuyucu sonucun hem istatistiksel önemini hem de orijinal birimdeki uygulamaya yönelik önemini değerlendirebilir.

16 Box-Cox Kuvvet Dönüşümleri
Box ve Cox (1964) tarafından geliştirilmiş, hem varyansı sabitleyen hem de normallik şartını sağlayan dönüşümlerdir. Dönüştürülmüş Yi(l) orijinal değişken yi’den yandaki eşitliğe göre oluşturulur. Bu yöntem tüm istatistiksel modeller ve her çeşit dönüşüm için kullanılabilir. l≠ 0 = 0 yg : geometrik ortalama

17 Box-Cox Kuvvet Dönüşümleri
= 0 l = 0 logaritmik dönüşüm l = -1 ters dönüşüm l = 1/2 karekök dönüşüm l = 1 dönüşüm yok

18 Örnek 7.5 Kitaptaki örnek 7.5’i inceleyin.
Şekil 7.4’ü siz de oluşturun.

19 Belirleme Limiti Verilen bir numunede özel bir ölçüm yöntemi kullanarak güvenilirlikle belirlenebilen bir maddenin en küçük miktarı ya da konsantrasyonu. Ancak kimyasal bir kavramdan çok istatistiksel bir kavram. Hassas bir istatistiksel tanımını yapmadan bilimsel olarak savunulması mümkün bir bulunma sınırı tanımlanamaz. Bu tip bir dayanağı olmadan bir şeyin olup olmadığı ya da ölçümlerin güvenilirliğinden söz edilemez. Belli başlı kurallar bu ölçüm hatasının belirlenmesinde yardımcı olmalıdır.

20 Belirleme Sınırı Aletin belirleme sınırı IDL sinyal ile gürültü arasındaki farkı verir. Eğer ölçüm yöntemi bir cihazla tek adımlık bir ölçümden oluşuyorsa sinyalin gürültüye oranı belirleme sınırının metodu ile ilgilidir. Alet hatalarını ve uygulanan tüm prosedürleri içine alan belirleme sınırı metodun belirleme sınırı (MDL) olarak bilinir.

21 MDL Cihazın Belirleme Sınırı Metotun Belirleme Sınırı Numune ---
Ölçüm Sonucu Seyreltme Özütleme Kurutma x CİHAZ Metotun Belirleme Sınırı

22 EPA’nın Yöntemi Bir maddenin ölçülebilecek ve %99 güvenilirlikle rapor edilebilecek en düşük konsantrasyon değeri Numune Sayısı: Aynı konsantrasyonda 7 numune (minimum) DL=tv,a=0.01s n=7  t6,0.01=3.143 (Excel’de =tters(0.02;6) DL=3.143s

23 EPA Yöntemi Ancak bu metot konsantrasyonun büyüklüğü ile değişiklik gösterebilir. Bunu kontrol etmek üzere daha farklı bir konsantrasyonda 7 yeni kopya örnek alınır. Eğer s12 ve s22 arasında F istatistiğine göre anlamlı bir fark yoksa F istatistiğine göre iki değişke arasında fark olup olmadığını anlamak için her iki örnekleme ait değişkelerin oranının, F kritik değerinden (a = 0,05 için) küçük olup olmadığına bakılır. Excel’de =fters(0,05;v1;v2) MBL = 2.681sb

24 Örnek Sıfır 1.25 mg/l 2.50 mg/l 5.0 mg/l 10.0 mg/l 2.5 2.8 4.5 3.9 12.2 3.0 2.7 3.7 5.0 13.8 2.2 3,4 3.8 5.4 9.9 2.4 4.4 4.9 9.5 3.1 6.2 8.9 4.6 4.1 3.6 4.3 4.8 4.0 3.3 1.7 4.7 Bir laboratuardan farklı konsantrasyondaki kurşun ölçümleri tabloda verilmiştir. Metodun belirleme sınırını bulun.

25 Örnek Verilen verilerden EPA yöntemine göre metodun belirleme sınırını bulmak için en az 7 ölçüm olan 1.25 ve 2.5 mg/l’lik ölçümler seçilir. Farklı konsantrasyonlarda değişkenin 1.25 mg/l 2.5mg/l 3.07 4.16 s2 0.548 0.407 s 0.746 0.638 n 20 14 Buna göre iki varyans değeri arasında anlamlı bir fark yok.

26 Örnek 1.25 mg/l 2.5mg/l 3.07 4.16 s2 0.548 0.407 s 0.746 0.638 n 20 14 MBL = 2.45sb MBL =1.72 mg/l

27 Alternatif Metot Pallesen’in yöntemi (1985), ABD’de güvenilirliği onaylanmış laboratuarlar için resmi olarak kabul görmüş bir yöntem olmamakla beraber, ölçümlerdeki değişkenin kaynaklarını göstermesi bakımından önemlidir. Pallesen’in belirleme limit tanımı: Kör numune ölçümlerinde bulunan rassal arka plan gürültüsünün üzerinde güvenilirlikle belirlenebilen en küçük değer.

28 Pallesen Metodu Pallesen’in yönteminde ölçümden kaynaklanan değişke ile arkaplan gürültüsünden kaynaklanan değişke ayrı ayrı ele alınır yi=η + ei=η + ai + bi ai rassal ölçüm hatası bi arkaplan gürültü seviyesi ei toplam rassal hata = ai + bi Her iki hatanın da rassal ve ortalaması 0 olan normal bir dağılım gösterdiği varsayılır.

29 Pallesen Metodu Arka plan gürültüsü (bi) kör numunelerde bile vardır ve sabit bir değişkeye sabittir. Ölçüm hatası (ai) ise ölçülen sinyalin (η) büyüklüğüyle orantılıdır. σa = κη Herhangi bir ölçümün toplam hata değişkesi bu durumda:

30 Pallesen Metodu h2’ (y2) ye karşılık se2 (se2) çizildiğinde doğrunun kesim noktası sb2’yi eğimi de k’yı verir.

31 Belirleme limiti bu durumda y’nin 0 olmadığı hipotezinin belli bir güvenilirlikle reddedilemeyeceği en küçük değerdir. Eğer y > MDL ise η = 0 olması pek mümkün değildir ve buradan ölçülmek istenen analit miktarının belirlenebildiği sonucu çıkar. Ancak eğer y < MDL ise analitin belirlenebildiğini söyleyemeyiz. y’nin , içinde analit bulunmadığı durumda, ortalaması 0 ve bir varyans ile normal dağılım gösterdiği varsayılırsa MDL arka plan gürültüsünün katı şeklinde ifade edilebilir: MDL = zaσb

32 z = 3.00 (a = ) kullanılırsa, y > MDL gözlemlenirse bu η ‘nin %99,87 güvenilirlik seviyesinde 0 olmadığı anlamına gelir.

33 Buna göre MDLEPA = 1.7 mg/l MDLPallesen = 1.6 mg/l

34 Soru EPA yöntemi ile Pallesen’in yöntemi arasındaki farklar nelerdir?

35 Farklar


"Veriyi Dönüştürme, Belirleme Limiti" indir ppt

Benzer bir sunumlar


Google Reklamları