Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı GÜVEN ARALIĞI HİPOTEZ TESTLERİ P DEĞERİ
İstatistiksel tahmin Örnekler popülasyon hakkında tahmin ve karar vermek için toplanır. Popülasyondan rassal olarak seçilen örneklemden hesaplanan istatistikle, popülasyonun uydu ğ u da ğ ılımın parametre de ğ erlerinin ara ş tırılması da denilebilir. Popülasyondan n hacimli rasgele örneklem seçilir Tahminlenecek parametre için istatistik hesaplanır İ statisti ğ in örneklem da ğ ılımının özelliklerinden yararlanarak parametre de ğ eri tahmin edilir. Belirli bir popülasyondan alınan n adet örneklemin ortalaması popülasyonun nokta tahminidir. Ana kütle N sayısı çok fazla ise çok de ğ i ş ik sayıda nokta tahmini yapılabilir.
İstatistiksel tahmin Nokta tahmini aynı popülasyondan alınan N sayıda farklı örneklemden yakın sonuçlar alınıyorsa güvenilirdir. Gerçekte bu çok mümkün olmaz. Güvenirli ğ i somut bir ş ekilde ortaya koymak için Güven Aralı ğ ı kavramı geli ş tirilmi ş tir. Tahmin edilecek parametrenin içinde yer alabilece ğ i simetrik bir aralı ğ ın önceden belirlenmi ş olasılıkta alt ve üst sınırının belirlenmesi gerekir.
Güven aralığı Popülasyona ait bir parametrenin örneklem istatisti ğ i kullanılarak tahmin edilmesine nokta tahmini denir. Nokta tahminimizin isabet derecesini ço ğ u zaman kesin olarak bilemeyiz. Dolayısıyla yaptı ğ ımız tahminin ne kadar güvenli oldu ğ unun ölçüsüne ihtiyaç duyarız. Popülasyon Ortalaması Örneklem Ortalaması Nokta Tahmini
Güven aralığı Yaptı ğ ımız tahmin bir hata payı da içerir. Bunu etkileyen üç önemli unsur vardır. De ğ erlendirmemizde ihtiyaç duyaca ğ ımız güven seviyesi nedir? Popülasyonun standart sapması Örneklem sayısı Hata payını eklemek için seçti ğ imiz güven aralı ğ ına göre Z tablosundan yararlanarak bunu gösterebiliriz. Böylece hata olasılı ğ ımızı da da ğ ılımın teorik özelliklerinden yararlanarak ifade edebiliriz.
Z TABLOSU VE GÜVEN ARALIĞI Z
Örnek Standart sapması 100 olarak bilinen 25 diyabet hastasının örneklem kan ş ekeri ortalaması 520 olarak bulunmu ş tur. %95 güven aralı ğ ına göre ortalamayı ifade ediniz. Hesaplama sonucu diyebiliriz ki %95 güvenle ve %5 hata payı ile hastaların kan ş ekeri de ğ eri ile arasında de ğ i ş mektedir diyebiliriz.
Örnek Standart sapması 4 olarak bilinen 100 ki ş inin Hb de ğ eri ortalaması 13,6 olarak bulunmu ş tur. %95 güven aralı ğ ına göre ortalamayı ifade ediniz.
Örnek Standart sapması 1,5 olarak bilinen 225 ki ş inin HbA1C de ğ eri ortalaması 4,6 olarak bulunmu ş tur. %39 güven aralı ğ ına göre ortalamayı ifade ediniz. %39
Hipotez testlerinde genel yaklaşım Hipotez testleri, ara ş tırmamızın ba ş ında sordu ğ umuz sorunun ve kurdu ğ umuz hipotezin kabulü veya reddi için ne kadar kanıt oldu ğ unu anlamamıza yardım eder. Hipotez testlerinde kural olarak a ş a ğ ıdaki 5 a ş ama izlenir: 1. Sıfır hipotezi (H 0 ) ve alternatif hipotezin (H 1 ) tanımlanması 2. Verilerin toplanması 3. İ lgili sıfır hipotezi için test istatisti ğ inin hesaplanması 4. Test istatisti ğ inden elde edilen de ğ erin bilinen bir olasılık da ğ ılımı ile kar ş ıla ş tırılması 5. P de ğ erinin ve sonuçların yorumlanması
İki yönlü ve tek yönlü hipotez Kar ş ıla ş tırılan grupların herhangi birisinin fazla olabilece ğ i duruma iki yönlü hipotez (two-tailed) denir. Ara ş tırmanın ba ş ında bir grubun kesinlikle ötekinden küçük ya da büyük olaca ğ ını ço ğ unlukla bilemedi ğ imizden genelde iki yönlü hipotez kurulur.
İki yönlü ve tek yönlü hipotez Tek yönlü hipotez ise gruplardan birinin ötekinden kesinlikle daha dü ş ük (veya yüksek) olamayaca ğ ının bilindi ğ i nadir durumlarda kurulur. Örn: AIDS hastalı ğ ında A ilacı kullanılması durumunda hastaların tamamı (%100) bir süre sonra ölmektedir. Yeni bir B ilacı A ilacıyla kar ş ıla ş tırılmak isteniyor. Ölümü önlemede B ilacının A ilacından daha kötü olma olasılı ğ ı olmadı ğ ından hipotezimizi tek yönlü kurabiliriz. Bu durumda H 0 ş öyle olur: “AIDS’ten ölümleri önlemede B ilacı A ilacından daha üstün de ğ ildir.”
İki yönlü ve tek yönlü hipotez Aynı ş ey e ş de ğ erlik ara ş tırmaları için de geçerlidir. Piyasada klasik olarak kullanılan bir orijinal amoksisillin ürünü oldu ğ unu dü ş ünelim. Farklı bir ilaç firması aynı etken maddede bir ürünü piyasaya sürmek istiyor. Bu durumda yeni ilacın orijinali kadar etkili oldu ğ unu ispat etmesi yeterli olacaktır. Zaten aynı etken maddesi oldu ğ undan orijinal ilaçtan daha etkili oldu ğ u gibi bir iddiası yoktur. H 0 hipotezimiz ş öyle olur: “Otitis medianın tedavisinde yeni çıkarılan B ilacı orijinal A ilacından daha az etkili de ğ ildir.”
İki yönlü ve tek yönlü hipotez İ ki yönlü hipoteze göre tek yönlü hipotezi test etmek daha kolay olacak ve ara ş tırma için daha az vaka gerekecektir. Hipotez kurulduktan sonra uygun bir istatistik yöntem seçilir ve istatistik test uygulanır. Uygulanacak formülden elde edilecek de ğ er H 0 hipotezini reddetmeye yöneliktir.
Çift Yönlü Tek Yönlü
A1 A2 0 Z
A 0 Z
A 0 Z
Hipotez testleri Olasılık da ğ ılımları ba ş lı ğ ı altında bahsedildi ğ i gibi, istatistik testler teorik olasılık da ğ ılımlarına göre yorumlanırlar. Test istatisti ğ inden elde etti ğ imiz de ğ eri teorik da ğ ılımımızın olasılık yo ğ unluk fonksiyonunun (çan e ğ risi) iki veya bir ucu ile kar ş ıla ş tırarak p de ğ erimizi elde ederiz. Bilgisayar programları bu de ğ eri otomatik olarak verir. p de ğ eri, de ğ i ş kenler arasındaki farklılı ğ ın ş ans eseri olma olasılı ğ ını verir.
Örnek Veri setimizde kadınlarla erkeklerin boylarını kar ş ıla ş tırmak istiyoruz. Erkeklerin VEYA kadınların boylarının daha uzun olabilece ğ ini varsayıyoruz. İ ki yönlü hipotez kurmalıyız: H 0 : boy uzunlu ğ u açısından kadınlarla erkekler arasında fark yoktur. H 1 : boy uzunlu ğ u açısından kadınlarla erkekler arasında fark vardır. “boy” numerik bir de ğ i ş ken. “erkekler” ve “kadınlar” olmak üzere birbirinden ba ğ ımsız iki grup var. Bu analiz için uygun test olan “ba ğ ımsız örneklerde t testi” yaparak çıkan p de ğ erine göre sonucu yorumlayabiliriz.
Analyze > Compare Means > Independent-Samples t test [“Test variables” kutusuna “height” de ğ i ş kenini, “Grouping variable” kutusuna “sex” de ğ i ş kenini koyalım. “Define Groups” butonunu tıklayıp “Group 1” için 1, “Group 2” için 2 yazalım > Continue > OK. A ş a ğ ıdaki çıktıyı elde ederiz:
p değerinin yorumlanması Sa ğ lık bilimlerindeki çalı ş malar için genelde 0,05’ten küçük bir p de ğ eri anlamlılık için yeterli sayılmaktadır. Yanılma payının çok daha önemli oldu ğ u astronomi gibi bilim dallarında p de ğ erleri için çok daha küçük sınırlar kullanılmaktadır. Görüldü ğ ü gibi bu sınırın belirlenmesi nispeten subjektiftir. Hata yaptı ğ ımızda ciddi sonuçlar olu ş abilecekse p de ğ erini %5 yerine %1 veya binde bir alabiliriz. Buna testimizin anlamlılık düzeyi deriz ve makalemizde de ‘p anlamlılık düzeyi %5 alınmı ş tır’ gibi ifade ederiz. Verilerimiz normal da ğ ıldı ğ ından elde etti ğ imiz test istatisti ğ i sonucunu normal da ğ ılım bilgilerimizi kullanarak yorumlayabiliriz.
Standart normal da ğ ılımda verilerin %1’i 2,58 standart sapma sınırındadır. Bu durumda bizim buldu ğ umuz de ğ er %0,1 (p<0,001) sınırından da ötededir.
Z
p değerinin yorumlanması
Kaynak 1. Aktürk Z, Acemo ğ lu H. Sa ğ lık Çalı ş anları İ çin Ara ş tırma ve Pratik İ statistik. Anadolu Ofset: İ stanbul, Prof. Dr. Kemal Turhan. Biyoistatistik ppt. Sunumu.