Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı HATA AYIKLAMA VE UÇ DEĞERLER.

Benzer bir sunumlar


... konulu sunumlar: "Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı HATA AYIKLAMA VE UÇ DEĞERLER."— Sunum transkripti:

1 Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı HATA AYIKLAMA VE UÇ DEĞERLER

2 De ğ i ş ken / Veri

3

4 Veri girişinin planlanması YER İ NE…

5 Veri girişinin planlanması

6 Hata ayıklama ve uç değerler Ara ş tırmalarımızda veri toplanması veya bilgisayara girilmesi a ş amalarında hatalar söz konusu olabilir. Veri giri ş indeki kuralların dikkatle uygulanması haline hata olasılı ğ ı da azalacaktır. Hatalı veriler açısından veritabanımızın gözden geçirilmesi ve analiz a ş amasına bundan sonra ba ş lanması çok önemlidir. Analizimizi yapıp makalemizi yazdıktan sonra bazı verilerin yanlı ş girildi ğ ini veya ölçüm sırasında hata yapıldı ğ ını bir dü ş ününüz! Bu tür durumlarda analizleri tamamen yeniden yapmak bile gerekebilir...

7 Hata ayıklama ve uç değerler En fazla hataya verileri bilgisayara girerken rastlıyoruz. Uzun veri formlarında daha hızlı veri giri ş i yapabilmek için bazen bilgisayar ekranına bakılmadan sırayla veriler girilebilir. Bu durumda bir de ğ i ş ken alanının atlanması halinde geriye kalan tüm veriler kaydırılmı ş olacaktır. Di ğ er bir hata da aynı tu ş a birden fazla kez basılmasıyla olabilir. Bu durumda da 2 yerine 22 veya 222 gibi de ğ erler girilmi ş olabilir.

8 Hata ayıklama ve uç değerler Hataları önlemek için verileri iki ki ş inin ayrı ayrı girmesi ve veritabanlarının kar ş ıla ş tırılması yapılabilir. Veri giri ş i sırasında azami dikkati gösterdikten sonra girilen verileri hatalar açısından yine de kontrol etmeliyiz.

9 Hata arama Girilebilecek de ğ erler sınırlı oldu ğ undan kategorik de ğ i ş kenleri hatalar açısından kontrol etmek nispeten daha kolaydır. Numerik de ğ i ş kenleri kontrol etmek daha zordur.

10 Hata arama Örnek: Verileri gözle tek tek kontrol edebiliriz. Büyük veritabanlarında bu zaman alacaktır. 1 Evet ve 2 Hayır olarak kodlanmı ş bir de ğ i ş kende 1 ve 2 dı ş ındaki de ğ erleri bulmak kolaydır. Numerik de ğ i ş keninde de uygunsuz verileri tahmin edebiliriz. Lise ö ğ rencilerinde yaptı ğ ımız bir ara ş tırmada ya ş aralı ğ ının 14-20 ya ş, hemoglobin de ğ erinin 10-16 mg/dl arasında olmasını bekleriz.

11 Hata arama SPSS’de hatalı verileri kolayca bulabilmek için; büyükten küçü ğ e sıralama frekans da ğ ılımı ve da ğ ılım geni ş li ğ i özelliklerini kullanabiliriz.

12 Hata ayıklama Veritabanımızda hata ayıklaması yapalım. Veriler “anket” de ğ i ş kenine göre sıralanmı ş durumda. “Ya ş ” de ğ i ş kenine bakaca ğ ız. Verileri bu de ğ i ş kene göre sıralayarak kontrol edebiliriz: Data>Sort cases>[“ya ş ” de ğ i ş kenini “sort by” alanına geçirelim]>ok

13 Hata ayıklama Age de ğ i ş keninin 20 ile 99 arasında da ğ ıldı ğ ını görüyoruz. Bu de ğ erler normal olabilir. 99 ya ş ındaki bireyin anketini (1 nolu anket) bulup ya ş ını kontrol edebiliriz.

14 Hata ayıklama Ba ş ka bir yöntem “ya ş ” de ğ i ş keninin da ğ ılım geni ş li ğ ine bakmak olabilir: Analyze>Descriptive Statistics>Descriptives>[“ya ş ” de ğ i ş kenini “Variable(s)” alanına geçirelim]>ok

15 Hata ayıklama Ya ş de ğ i ş kenine 16 birey için veri girildi ğ ini, en küçük ya ş ın 20, en büyük ya ş ın 99 oldu ğ unu görüyoruz.

16 Hata ayıklama Kategorik bir de ğ i ş kene bakalım. “cinsiyet” de ğ i ş keni için de aynen yukarıdaki örnekte oldu ğ u gibi sıralama yaparak kontrol edebiliriz. Ba ş ka bir yöntem de bu de ğ i ş kenin frekans da ğ ılımına bakmak olabilir: Analyze>Descriptive Statistics>Frequencies>[“cinsiyet” de ğ i ş kenini “Variable(s)” alanına geçirelim]>ok

17 Hata ayıklama Cinsiyet için 16 veri girildi ğ ini, 2 adet 1 (Erkek), 10 adet 2 (Kadın), bir adet 3, bir adet 4, bir adet 11 ve bir adet te 22 girildi ğ ini görüyoruz. 11 olarak girilen verinin 1 (Erkek), 22 olarak girilen verinin de 2 (Kadın) olma ihtimali yüksektir. Bu 4 veriyi de anket numaralarını bularak kontrol etmeli, hatayı bulup düzeltmeliyiz.

18 Eksik veriler (missing) Eksik verilerin birkaç nedeni olabilir: 1- Birey reddetti ğ i için veri alınamamı ş tır (örne ğ in, birey alkol kullanma durumunu belirtmek istemeyebilir) 2- Bireye uygun olmadı ğ ı için veri alınamamı ş tır (örn. erkek katılımcı “do ğ um kontrol hapı kullanıyor musunuz?” sorusunu bo ş bırakacaktır) 3- Veri alınmı ş tır ama bilgisayara girilmemi ş tir (sekreter hatası). Eksik verinin sebebi ne olursa olsun istenmeyen bir durumdur. Veri eksikli ğ i olan de ğ i ş ken esas ara ş tırma konumuz (sonuç ölçütü) ise bu durum daha da ciddidir. Hatta bazı analizler yapılamaz veya sonuçların güvenilirli ğ i etkilenir.

19 Uç değerler Uç de ğ erler, di ğ er verilerle kar ş ıla ş tırıldı ğ ında veri setine uygun olmadı ğ ı dü ş ünülen a ş ırı de ğ erlerdir. Bu a ş ırı de ğ erler hatalı olabilece ğ i gibi gerçe ğ i de yansıtabilir. Bu nedenle hata ayıklaması yapılmalı ve do ğ rulu ğ u kontrol edilmelidir Bir bayanın 190 cm boyunda olması bir uç de ğ erdir. Ancak, nadir de olsa bu durum mümkündür. Varsa bu bireyin ya ş ve a ğ ırlık verilerine de bakarak yorum yapabiliriz.

20 Uç değerler Uç de ğ erlerin gerçe ğ i yansıttı ğ ına karar verdi ğ imizde bu de ğ erleri korumalıyız. Bir uç de ğ er ancak ş üpheli bulunması halinde silinmelidir. Uç de ğ erlerin fazla olması yapaca ğ ımız istatistiksel analizleri de etkileyebilir.

21 Uç değerler Uç de ğ erlimizin olup olmadı ğ ını verileri sıralayarak gözümüzle kontrol edebiliriz. Bir yöntem de saplı kutu grafikleri (boxplots) yaparak bakmaktır: Graphs>Legacy Dialogs>Boxplot [Simple, Summaries for groups of cases seçip Define butonuna tıklayınız]>[Y eksenine “Boy”, X eksenine “Cinsiyet” de ğ i ş kenlerini koyalım]>OK Saplı kutu grafiklerinde sap kısmının dı ş ında i ş aretlenen bireyler uç de ğ erleri temsil etmektedir.

22 Uç değerler SPSS’de saplı kutu grafikleri çizildi ğ inde kutunun sap kısmının dı ş ında uç de ğ erler ve a ş ırı de ğ erler de gösterilir. Veri kutudan uzaklı ğ ına göre “uç de ğ er” (outlier), veya “a ş ırı de ğ er” (extreme) olarak tanımlanır. SPSS çıktısında uç de ğ erler daire ile, a ş ırı de ğ erler ise yıldızla görülmektedir

23 Uç değerler

24 SPSS’de birden fazla de ğ i ş ken için aynı anda saplı kutu grafikleri çizdirip uç de ğ erlere bakmak mümkündür Graphs>Legacy Dialogues>Boxplot [Simple, Summaries of seperate variables seçip Define butonuna tıklayınız]>[“ya ş ”, “boy”, “kilo” de ğ i ş kenlerini “Boxes represent:” alanına geçiriniz]>OK.

25 Uç değerler Görüldü ğ ü üzere “Ya ş de ğ i ş keninde 3. bireyin ya ş ı (23 ya ş ında) uç de ğ er olarak, 1. bireyin ya ş ı (39 ya ş ında) a ş ırı de ğ er olarak belirtilmi ş tir. “Boy” de ğ i ş keninde de hem uç, hem de a ş ırı de ğ erler vardır. Kilo de ğ i ş keninde uç de ğ er vardır ama a ş ırı de ğ er saptanmamı ş tır.

26 Uç değerler Bu grafikte “age” de ğ i ş keninde 112. bireyin ya ş ı (90 ya ş ında) uç de ğ er olarak belirtilmi ş tir. “Weight” de ğ i ş keninde ise hem uç, hem de a ş ırı de ğ erler vardır. Height de ğ i ş keninde a ş ırı ve uç de ğ er saptanmamı ş tır.

27 Kaynak 1. Aktürk Z, Acemo ğ lu H. Sa ğ lık Çalı ş anları İ çin Ara ş tırma ve Pratik İ statistik. Anadolu Ofset: İ stanbul, 2011.


"Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı HATA AYIKLAMA VE UÇ DEĞERLER." indir ppt

Benzer bir sunumlar


Google Reklamları