Veriyi Dönüştürme, Belirleme Limiti

Slides:



Advertisements
Benzer bir sunumlar
Normal Dağılım Dışındaki Teorik Dağılımlar
Advertisements

Çıkarımsal İstatistik
Bölüm 5 Örneklem ve Örneklem Dağılımları
Kütle varyansı için hipotez testi
İki kütle ortalamasının farkının güven aralığı
MERKEZİ YIĞILMA (EĞİLİM) ÖLÇÜLERİ
Model Geçerliliğinin Belirlenmesi
Kalibrasyon.
R2 Belirleme Katsayısı.
ANOVA.
Etkensel Deney Tasarımı
İKİ DEĞİŞKENLİ BASİT DOĞRUSAL REGRESYON MODELİ
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
Tanımlayıcı İstatistikler
Tıp alanında kullanılan temel istatistiksel kavramlar
ÖLÇME VE DEĞERLENDİRME DERSİ
OLASILIK DAĞILIMLARI Bu kısımda teorik olasılık dağılımları incelenecektir. Gerçek hayatta birçok olayın dağılımı bu kısımda inceleyeceğimiz çeşitli olasılık.
DERS-7 TESTLER Prof. Dr. Hüseyin BAŞLIGİL YILDIZ TEKNİK ÜNİVERSİTESİ
Kısmi Etkensel Deney Tasarımı
Regresyonla Etkensel Deneylerin İncelenmesi
Hesaplanan Parametrelerin Hassasiyeti ve Güvenirlik Bölgesi
KOŞULLU ÖNGÖRÜMLEME.
OLASILIK ve OLASILIK DAĞILIMLARI
ÖNEMLİLİK TESTLERİ Dr.A.Tevfik SÜNTER
Temel İstatistik Terimler
Değişkenlik Ölçüleri.
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
Büyük ve Küçük Örneklemlerden Kestirme
Korelasyon (Bağıntı) Parametre Tayini, Karelerin En Küçüğü Yöntemi
OLASILIK ve KURAMSAL DAĞILIMLAR
TANIMLAYICI İSTATİSTİKLER
İki Ortalama Farkının Test Edilmesi
Betimleyici İstatistik – I
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
…ÇOKLU REGRESYON MODELİ…
İSTATİKSEL KAVRAMLAR İstatistik Doç. Dr. Şakir GÖRMÜŞ SAÜ| e-FEK.
Örneklem Dağılışları.
Tanımlayıcı İstatistikler
Uygulama 3.
Örneklem Dağılışları ve Standart Hata
Nicel Analizlere Giriş
İSTATİSTİK YGULAMALARI: SINAVA HAZIRLIK
Bölüm 03 Sayısal Tanımlama Teknikleri
Sayısal Analiz 7. Hafta SAÜ YYurtaY.
İSTATİSTİKTE TAHMİN ve HİPOTEZ TESTLERİ İSTATİSTİK
Sürekli Olasılık Dağılımları
Çıkarsamalı İstatistik Yöntemler
Korelasyon testleri Pearson korelasyon testi Spearman korelasyon testi Regresyon analizi Basit doğrusal regresyon Çoklu doğrusal regresyon BBY252 Araştırma.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
İSTATİSTİK II Örnekleme Dağılışları & Tahminleyicilerin Özellikleri.
OLASILIK ve İSTATİSTİK
ÖLÇME VE DEĞERLENDİRME DERSİ
Teorik Dağılımlar: Diğer Dağılımlar
DERS3 Prof.Dr. Serpil CULA
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Prof. Dr Hamit ACEMOĞLU Tıp Eğitimi AD
Hidrolojinin Yöntemleri
MERKEZİ EĞİLİM(YIĞILMA) ÖLÇÜLERİ
DEĞİŞİM ÖLÇÜLERİ.
ÜSTEL DÜZLEŞTİRME YÖNTEMİ
İŞLU İstatistik -Ders 3-.
Temel İstatistik Terimler
5.1 POLİNOMİNAL REGRESSİYON
Uygulama I.
UYGULAMA II.
OLASILIK DAĞILIMLARI Bu kısımda teorik olasılık dağılımları incelenecektir. Gerçek hayatta birçok olayın dağılımı bu kısımda inceleyeceğimiz çeşitli olasılık.
Temel İstatistik Terimler
Korelasyon testleri Pearson korelasyon testi Spearman korelasyon testi Regresyon analizi Basit doğrusal regresyon Çoklu doğrusal regresyon BBY606 Araştırma.
BÖLÜM 6: Hidroloji (Akım Ölçümü ve Veri Analizi) / Prof. Dr. Osman YILDIZ (Kırıkkale Üniversitesi)
Sunum transkripti:

Veriyi Dönüştürme, Belirleme Limiti

Veri Dönüştürme Verinin orijinal birimi yerine aşağıdaki dönüşümler kullanılarak verinin daha kolay incelenmesi sağlanır. Log(Y) Karekök(y) 1/y Ya da y’nin diğer bir fonksiyonu Örneğin pH için –log([H+]) kullanılır. Niçin? Bakterilerle ilgili araştırmalarda ise bakteri sayısı N yerine logN kullanılır. Neden?

Neden Dönüşümler Kullanılıyor? 1. İki değişkeni arasında düz doğrusal bir ilişki elde etmek için (Daha basit model kullanmak üzere) 1200 1000 800 600 400 100 10000 1000 100 10 MPN t t

Neden Dönüşümler Kullanılıyor? 2.Orijinal verinin değişken varyansa sahip olması. Regresyon kullanarak veriye eğilimi çizgisi uydururken bu varyans değişikliği sorun yaratır. Dy = veri değeri-model değer Doğruya en uzaktaki noktaların güçlü bir etkisi olur, çünkü regresyon bu mesafeyi en aza indirmek ister. Sonuçta doğrunun oluşmasında hassasiyetle ölçülmüş 1. noktadaki veri, t=3’te ölçülmüş veriden daha az etkili olur. Oysaki her ver noktasının eşit ağırlıkta olması tercih edilir. Yandaki örnekte log dönüşümü her veri noktası için değişken olmayan bir varyans(değişke) sağlar. x 1 2 3 t

Dönüştürme ile her veri doğrunun yerini belirlenmesinde hemen hemen eşit bir etkiye sahip olur. Logaritmik dönüşüm bu eşit ağırlığı sağlamak için kullanılır. x logx t t

Önemli Hususlar Bazen dönüşüm iyi bir durumu kötü bir duruma dönüştürebilir. Orijinal verideki sabit varyans dönüşüm sonrası değişken bir hale gelebilir. Bu durumda veriniz lineer hale gelmiş olabilir ancak dönüşüm yararlı olmaz. Y1/y dönüşümü özellikle varyansı kötü etkiler. Kullanılmadan önce mutlaka kontrol edilmelidir.

Önemli Hususlar Bazen ölçümler yedekli yapılmaz. Sadece tek ölçüm yapılır. Bu durumda varyansın dönüşümden nasıl etkilendiği bilinemez. Bu nedenle her zaman tekrar ölçümler yapmak iyi bir deney stratejisi için kaçınılmazdır.

Varyans Sabitleme Dönüşümleri Yapılan deneyde ölçülen parametrenin değerleri aralığında varyansın değişken olması: Ölçümlerin seyreltme ya da çoklu hataları artırıcı aşamalardan oluşması (Ekstraksiyon) Log ölçekte okuyan bir alet kullanmak Biyolojik sayımlar

Tablo 7.1 Durum y yerine kullanılan Not s a y2 s a y3/2 s a y (s2>y) s a y1/2 1/y 1/√y Log(y) , log(y+c) √y (√y +c) Bazı y>0 s2>y arcsin√p p = oran ya da yüzde

Karekök ve logaritmik dönüşümlerde büyük değerler küçüklere oranla daha az önemli hale gelir. 0, 1, 4 (4’ün önemi baskın) √y dönüşümü ile 0,1,2’ye dönüşür. Son terimin baskın rolü azalır.

Örnek 5 istasyondan toplanan (Tablo 7.2) plankton eş ölçüm numunelerinin ortalamaları ve varyansları tablo B’de verilmiştir. Varyansın sabit olmadığı gözlemlenmiştir. Ortalama değeri (y) arttıkça varyans (s2) orantılı olarak artmaktadır. Bu veri için uygun dönüşüm hangisidir?

Örnek,Çözüm s TABLO B İstasyon 1 2 3 4 5 Orijinal Veri y s2 y0.5 0.85 0.77 0.92 0.88 2.05 1.84 1.43 1.36 3.90 3.67 1.97 1.92 4.60 4.78 2.14 2.19 9.25 7.57 3.04 2.75 Yandaki şekilden görüldüğü gibi s a y1/2 olduğundan Tablo 7.1’e göre karekök dönüşümü uygundur. c = 0.5 y = Karekök(y+0.5)

Örnek,Çözüm Tablo 7.1’e göre karekök dönüşümünün uygun olduğunu gösterir. c = 0.5 y = Karekök(y+0.5) TABLO B İstasyon 1 2 3 4 5 Orijinal Veri y s2y 0.85 0.77 2.05 1.84 3.90 3.67 4.60 4.78 9.25 7.57 Dönüştürülmüş Veri x s2x 1.10 0.14 1.54 0.19 0.21 2.21 0.24 3.09 0.20

Güvenilirlik Aralığı ve Dönüşümler Örnek: 5 gözlemden oluşan bir örneklemin [95, 20, 74, 195, 71] ortalaması 91, varyansı 4140’dır. Hangi dönüşüm kullanılmalıdır? Çözüm: s2>y. Log dönüş uygulanabilir. x = logy, [1.977 1.301,1.869,2.290, 1.851]. xort=1.86,s2x=0.128 v=5-1 =4, a =0.05/2 = 0.025 t(4,0.025) = 2.776 %95 lik güvenilirlik aralığı= 1.41405< mx <2.301 x’i orijinal ölçeğine dönüştürerek y’nin geometrik ortalamasını elde ederiz. yg = antilog(1.85756) = 72.09 25.94< my<200.29 (asimetrik)

Örnek 1.41405< mx <2.301 25.94< my<200.29 (asimetrik) Nasıl sunmalı? Dönüştürülmüş birimde standart hata ve güvenilirlik aralığını, artı orijinal birimdeki artimetik ve geometrik ortalamayı. Böylece okuyucu sonucun hem istatistiksel önemini hem de orijinal birimdeki uygulamaya yönelik önemini değerlendirebilir.

Box-Cox Kuvvet Dönüşümleri Box ve Cox (1964) tarafından geliştirilmiş, hem varyansı sabitleyen hem de normallik şartını sağlayan dönüşümlerdir. Dönüştürülmüş Yi(l) orijinal değişken yi’den yandaki eşitliğe göre oluşturulur. Bu yöntem tüm istatistiksel modeller ve her çeşit dönüşüm için kullanılabilir. l≠ 0 = 0 yg : geometrik ortalama

Box-Cox Kuvvet Dönüşümleri = 0 l = 0 logaritmik dönüşüm l = -1 ters dönüşüm l = 1/2 karekök dönüşüm l = 1 dönüşüm yok

Örnek 7.5 Kitaptaki örnek 7.5’i inceleyin. Şekil 7.4’ü siz de oluşturun.

Belirleme Limiti Verilen bir numunede özel bir ölçüm yöntemi kullanarak güvenilirlikle belirlenebilen bir maddenin en küçük miktarı ya da konsantrasyonu. Ancak kimyasal bir kavramdan çok istatistiksel bir kavram. Hassas bir istatistiksel tanımını yapmadan bilimsel olarak savunulması mümkün bir bulunma sınırı tanımlanamaz. Bu tip bir dayanağı olmadan bir şeyin olup olmadığı ya da ölçümlerin güvenilirliğinden söz edilemez. Belli başlı kurallar bu ölçüm hatasının belirlenmesinde yardımcı olmalıdır.

Belirleme Sınırı Aletin belirleme sınırı IDL sinyal ile gürültü arasındaki farkı verir. Eğer ölçüm yöntemi bir cihazla tek adımlık bir ölçümden oluşuyorsa sinyalin gürültüye oranı belirleme sınırının metodu ile ilgilidir. Alet hatalarını ve uygulanan tüm prosedürleri içine alan belirleme sınırı metodun belirleme sınırı (MDL) olarak bilinir.

MDL Cihazın Belirleme Sınırı Metotun Belirleme Sınırı Numune --- Ölçüm Sonucu Seyreltme Özütleme Kurutma x CİHAZ Metotun Belirleme Sınırı

EPA’nın Yöntemi Bir maddenin ölçülebilecek ve %99 güvenilirlikle rapor edilebilecek en düşük konsantrasyon değeri Numune Sayısı: Aynı konsantrasyonda 7 numune (minimum) DL=tv,a=0.01s n=7  t6,0.01=3.143 (Excel’de =tters(0.02;6) DL=3.143s

EPA Yöntemi Ancak bu metot konsantrasyonun büyüklüğü ile değişiklik gösterebilir. Bunu kontrol etmek üzere daha farklı bir konsantrasyonda 7 yeni kopya örnek alınır. Eğer s12 ve s22 arasında F istatistiğine göre anlamlı bir fark yoksa F istatistiğine göre iki değişke arasında fark olup olmadığını anlamak için her iki örnekleme ait değişkelerin oranının, F kritik değerinden (a = 0,05 için) küçük olup olmadığına bakılır. Excel’de =fters(0,05;v1;v2) MBL = 2.681sb

Örnek Sıfır 1.25 mg/l 2.50 mg/l 5.0 mg/l 10.0 mg/l 2.5 2.8 4.5 3.9 12.2 3.0 2.7 3.7 5.0 13.8 2.2 3,4 3.8 5.4 9.9 2.4 4.4 4.9 9.5 3.1 6.2 8.9 4.6 4.1 3.6 4.3 4.8 4.0 3.3 1.7 4.7 Bir laboratuardan farklı konsantrasyondaki kurşun ölçümleri tabloda verilmiştir. Metodun belirleme sınırını bulun.

Örnek Verilen verilerden EPA yöntemine göre metodun belirleme sınırını bulmak için en az 7 ölçüm olan 1.25 ve 2.5 mg/l’lik ölçümler seçilir. Farklı konsantrasyonlarda değişkenin 1.25 mg/l 2.5mg/l y¯ 3.07 4.16 s2 0.548 0.407 s 0.746 0.638 n 20 14 Buna göre iki varyans değeri arasında anlamlı bir fark yok.

Örnek 1.25 mg/l 2.5mg/l y¯ 3.07 4.16 s2 0.548 0.407 s 0.746 0.638 n 20 14 MBL = 2.45sb MBL =1.72 mg/l

Alternatif Metot Pallesen’in yöntemi (1985), ABD’de güvenilirliği onaylanmış laboratuarlar için resmi olarak kabul görmüş bir yöntem olmamakla beraber, ölçümlerdeki değişkenin kaynaklarını göstermesi bakımından önemlidir. Pallesen’in belirleme limit tanımı: Kör numune ölçümlerinde bulunan rassal arka plan gürültüsünün üzerinde güvenilirlikle belirlenebilen en küçük değer.

Pallesen Metodu Pallesen’in yönteminde ölçümden kaynaklanan değişke ile arkaplan gürültüsünden kaynaklanan değişke ayrı ayrı ele alınır yi=η + ei=η + ai + bi ai rassal ölçüm hatası bi arkaplan gürültü seviyesi ei toplam rassal hata = ai + bi Her iki hatanın da rassal ve ortalaması 0 olan normal bir dağılım gösterdiği varsayılır.

Pallesen Metodu Arka plan gürültüsü (bi) kör numunelerde bile vardır ve sabit bir değişkeye sabittir. Ölçüm hatası (ai) ise ölçülen sinyalin (η) büyüklüğüyle orantılıdır. σa = κη Herhangi bir ölçümün toplam hata değişkesi bu durumda:

Pallesen Metodu h2’ (y2) ye karşılık se2 (se2) çizildiğinde doğrunun kesim noktası sb2’yi eğimi de k’yı verir.

Belirleme limiti bu durumda y’nin 0 olmadığı hipotezinin belli bir güvenilirlikle reddedilemeyeceği en küçük değerdir. Eğer y > MDL ise η = 0 olması pek mümkün değildir ve buradan ölçülmek istenen analit miktarının belirlenebildiği sonucu çıkar. Ancak eğer y < MDL ise analitin belirlenebildiğini söyleyemeyiz. y’nin , içinde analit bulunmadığı durumda, ortalaması 0 ve bir varyans ile normal dağılım gösterdiği varsayılırsa MDL arka plan gürültüsünün katı şeklinde ifade edilebilir: MDL = zaσb

z = 3.00 (a = 0.0013) kullanılırsa, y > MDL gözlemlenirse bu η ‘nin %99,87 güvenilirlik seviyesinde 0 olmadığı anlamına gelir.

Buna göre MDLEPA = 1.7 mg/l MDLPallesen = 1.6 mg/l

Soru EPA yöntemi ile Pallesen’in yöntemi arasındaki farklar nelerdir?

Farklar