Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı HATA AYIKLAMA VE UÇ DEĞERLER.

Slides:



Advertisements
Benzer bir sunumlar
SPSS ile Araştırma Bulgularını Analiz Etme ve Yorumlama
Advertisements

Özgür GÜVEN GÜNAY, Prof. Dr. Pars TUNÇYÜREK
-ÇAPRAZ TABLOLAR -İKİ DEĞİŞKENLİ ANALİZ -ANALİZE BAŞKA BİR DEĞİŞKEN EKLEMEK -ÖRNEKLEM SEÇİMİ -HEDEFLENMİŞ ÖRNEKLEM SEÇİMİ -RASGELE ÖRNEKLEM SEÇİMİ.
 1 Ekim 2010 ile 1 Kasım 2010 tarihleri arasında İ stanbul Haydarpa ş a Numune E ğ itim ve Ara ş tırma Hastanesi Acil Servisine ba ş vuran toplam 985.
BAŞLIK METNİ ATATÜRK ÜNİVERSİTESİ BEDEN EĞİTİMİ VE SPOR YÜKSEKOKULU ÖĞRENCİLERİNİN 25. DÜNYA ÜNİVERSİTELER KIŞ OYUNLARI ERZURUM 2011 VE BRANŞLARI HAKKINDAKİ.
Amaç: Amaç: Tıp Fakültesi öğrencilerinin üniversiteye giriş başarısının dönem içerisindeki başarısıyla orantılı olup olmadığı her zaman bir soru işareti.
Yrd. Doç. Dr Hamit ACEMOĞLU
Kurulu ş Misyon Vizyon Amaçlar ve Hedefler E ğ itim-ö ğ retim alt yapısı Fakülte Bina Proje Süreci Akademik Kadro Da ğ ılımı Eylem Planı Stratejik Plan.
SPSS İlk Açılışı.
MERKEZİ DAĞILIM ÖLÇÜTLERİ YAYGINLIK ÖLÇÜTLERİ
VERİ ÇEŞİTLERİ Doç. Dr. Turan SET
Veri Toplama, Verilerin Özetlenmesi ve Düzenlenmesi
TÜRETİLMİŞ VERİLER VE HASTALIK ÖLÇÜTLERİ
VERİLERİN GRAFİKLERLE GÖSTERİLMESİ
Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı BİYOİSTATİSTİĞE GİRİŞ.
TEMEL KALİTE İYİLEŞTİRME ARAÇLARII
TEST İSTATİSTİĞİNİN SEÇİLMESİ
Tıp Fakültesi 1 ve 4. Sınıflar Arasında Gözlük/Lens Kullanımı ve Öğrencilerin Lazer Göz Ameliyatına Bakış Açısı Hazırlayanlar*; Hatice Hancı, İsmail Tarduş,
DİYAGRAMLAR VE GRAFİKLER
YAZAR: Aylin TUTGUN ÜNAL
Yıldırım BAHADIR Programcı-Proje Sorumlusu Karabük Valili ğ i Bilgi İş lem Ş ube Müdürlü ğ ü.
MEASUREMENT *Nazan SONDAÇ *Didem ATASEVEN *Halise ARGUÇ.
5.GRUP Şule Şahin Tuğba Karakuş Gizem Osan
Amaç: Organ yetmezliği insidansı (toplumdaki hastalık sayısı oranı) tüm dünyada artmakta olup, organ nakli olmayı bekleyen hastalar da uygun organ beklerken.
ÖLÇME VE DEĞERLENDİRME DERSİ
KOCAELİ ÜNİVERSİTESİ TIP FAKÜLTESİ
Nasıl Test Çözülür? Rehberlik Servisi.
BENGÜ YILDIRIM  Kullanıcı random olarak gelen kelimeyi tahmin etmeye çalı ş maktadır.  Aranan kelimenin harfleri üst kısımda pembe kutular.
TIP FAKÜLTESİ ÖĞRENCİLERİNİN BAŞARISINDA
HANGİ ÖĞRENİM SİSTEMİ DAHA MEMNUN EDİCİ?
TIP FAKÜLTESİ ÖĞRENCİLERİNDE DEPRESYON BELİRTİLERİ TAŞIMA DURUMU
GİRİŞ BULGULAR YÖNTEM SONUÇ
E-OKUL ÜZERİNDEN GÜNCELLENMESİ GEREKEN VERİ EKRANLARI
Yrd. Doç. Dr. Hamit ACEMOĞLU
Tanımlayıcı İstatistik
Sayısal Tanımlayıcı Teknikler
Maliye’de SPSS Uygulamaları Doç. Dr. Aykut Hamit Turan SAÜ İİBF/ Maliye Bölümü.
Asimetri ve Basıklık Ölçüleri
EVC İ L HAYVAN BESLEMEN İ N YET İŞ K İ NLERDE DEPRESYON DÜZEY İ İ LE İ L İŞ K İ S İ N İ N İ NCELENMES İ.
AROMAT İ K KEK İ K YA Ğ I KOKUSUNUN DERS TUTUMU ÜZER İ NE ETK İ S İ N İ N İ NCELENMES İ.
Grup 101 Berat Duman Salih Yartunç.   Bu çalışmanın temel amacı Melikşah Üniversitesi öğrencilerinin sosyal kaygı düzeyleri, kaygı duyarlılıkları ve.
Non Parametrik Hipotez Testleri
Değişkenler Arasındaki İlişkiler
Maliye’de SPSS Uygulamaları
SPSS’e Giriş SPSS Uygulamaları Doç. Dr. Aykut Hamit Turan
HATA VE HATA ANAL İ Z İ. 2  Fiziksel veya sosyal olayların matematiksel olarak çözülmelerinde yapılan hatalar genellikle üç ana ba ş lıkta toplanır.
Güven Aralıkları Prof. Dr. Hamit ACEMOĞLU. Amaç: Bu konu sonunda okuyucunun güven aralıkları hakkında bilgi sahibi olması amaçlanmıştır. Hedefler: Bu.
Hata ayıklama ve uç değerler
Verilerin grafiklerle gösterilmesi
Merkezi dağılım (yığılma) ölçütleri – the average 1/ 24.
Temel Matematik 2 10-Seriler Temel Matematik 2 10-Seriler Ocak 2016 İ stanbul Üniversitesi Prof. Dr. Ergün Ero ğ lu İ Ü İ şletme Fakültesi Sayısal Yöntemler.
Lineer Regresyon. Amaç: Bu konu sonunda Tıp Fakültesi 1. sınıf öğrencilerinin çeşitli bağımsız değişkenleri kullanarak bir nümerik değişkenin değerini.
Verilerimi nasıl toplamalıyım? Analize nasıl hazırlamalıyım?
Veri dönüştürme Prof. Dr Hamit ACEMOĞLU / 22 1.
Hipotez Testleri.
ÖLÇME VE DEĞERLENDİRME DERSİ
ANKARA İL SAĞLIK MÜDÜRLÜĞÜ ACİL YARDIM VE KURTARMA HİZMETLERİ (112) AMBULANS EKİPLERİNDE ÇALIŞAN SAĞLIK PERSONELİNİN İŞ DOYUMLARININ VE ETKİLEYEN ETMENLERİN.
VERİLERİN DEĞERLENDİRİLMESİ VE ANALİZİ
SPSS’te Temel İstatistikler
ERROR CHECKING and OUTLIERS
Numerik Veri Tek Grup Prof. Dr. Hamit ACEMOĞLU.
İŞLU İstatistik -Ders 1-.
Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı GÜVEN ARALIĞI HİPOTEZ TESTLERİ P DEĞERİ.
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
NİŞANTAŞI ÜNİVERSİTESİ
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
8.Hafta ANCOVA Kovaryans Analizi
Konum ve Dağılım Ölçüleri BBY606 Araştırma Yöntemleri Güleda Doğan
3.Hafta Bağımsız Örneklem t Testi (Independent t Test) Mann Whitney U
Sunum transkripti:

Doç. Dr. Turan SET Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile Hekimli ğ i Anabilim Dalı HATA AYIKLAMA VE UÇ DEĞERLER

De ğ i ş ken / Veri

Veri girişinin planlanması YER İ NE…

Veri girişinin planlanması

Hata ayıklama ve uç değerler Ara ş tırmalarımızda veri toplanması veya bilgisayara girilmesi a ş amalarında hatalar söz konusu olabilir. Veri giri ş indeki kuralların dikkatle uygulanması haline hata olasılı ğ ı da azalacaktır. Hatalı veriler açısından veritabanımızın gözden geçirilmesi ve analiz a ş amasına bundan sonra ba ş lanması çok önemlidir. Analizimizi yapıp makalemizi yazdıktan sonra bazı verilerin yanlı ş girildi ğ ini veya ölçüm sırasında hata yapıldı ğ ını bir dü ş ününüz! Bu tür durumlarda analizleri tamamen yeniden yapmak bile gerekebilir...

Hata ayıklama ve uç değerler En fazla hataya verileri bilgisayara girerken rastlıyoruz. Uzun veri formlarında daha hızlı veri giri ş i yapabilmek için bazen bilgisayar ekranına bakılmadan sırayla veriler girilebilir. Bu durumda bir de ğ i ş ken alanının atlanması halinde geriye kalan tüm veriler kaydırılmı ş olacaktır. Di ğ er bir hata da aynı tu ş a birden fazla kez basılmasıyla olabilir. Bu durumda da 2 yerine 22 veya 222 gibi de ğ erler girilmi ş olabilir.

Hata ayıklama ve uç değerler Hataları önlemek için verileri iki ki ş inin ayrı ayrı girmesi ve veritabanlarının kar ş ıla ş tırılması yapılabilir. Veri giri ş i sırasında azami dikkati gösterdikten sonra girilen verileri hatalar açısından yine de kontrol etmeliyiz.

Hata arama Girilebilecek de ğ erler sınırlı oldu ğ undan kategorik de ğ i ş kenleri hatalar açısından kontrol etmek nispeten daha kolaydır. Numerik de ğ i ş kenleri kontrol etmek daha zordur.

Hata arama Örnek: Verileri gözle tek tek kontrol edebiliriz. Büyük veritabanlarında bu zaman alacaktır. 1 Evet ve 2 Hayır olarak kodlanmı ş bir de ğ i ş kende 1 ve 2 dı ş ındaki de ğ erleri bulmak kolaydır. Numerik de ğ i ş keninde de uygunsuz verileri tahmin edebiliriz. Lise ö ğ rencilerinde yaptı ğ ımız bir ara ş tırmada ya ş aralı ğ ının ya ş, hemoglobin de ğ erinin mg/dl arasında olmasını bekleriz.

Hata arama SPSS’de hatalı verileri kolayca bulabilmek için; büyükten küçü ğ e sıralama frekans da ğ ılımı ve da ğ ılım geni ş li ğ i özelliklerini kullanabiliriz.

Hata ayıklama Veritabanımızda hata ayıklaması yapalım. Veriler “anket” de ğ i ş kenine göre sıralanmı ş durumda. “Ya ş ” de ğ i ş kenine bakaca ğ ız. Verileri bu de ğ i ş kene göre sıralayarak kontrol edebiliriz: Data>Sort cases>[“ya ş ” de ğ i ş kenini “sort by” alanına geçirelim]>ok

Hata ayıklama Age de ğ i ş keninin 20 ile 99 arasında da ğ ıldı ğ ını görüyoruz. Bu de ğ erler normal olabilir. 99 ya ş ındaki bireyin anketini (1 nolu anket) bulup ya ş ını kontrol edebiliriz.

Hata ayıklama Ba ş ka bir yöntem “ya ş ” de ğ i ş keninin da ğ ılım geni ş li ğ ine bakmak olabilir: Analyze>Descriptive Statistics>Descriptives>[“ya ş ” de ğ i ş kenini “Variable(s)” alanına geçirelim]>ok

Hata ayıklama Ya ş de ğ i ş kenine 16 birey için veri girildi ğ ini, en küçük ya ş ın 20, en büyük ya ş ın 99 oldu ğ unu görüyoruz.

Hata ayıklama Kategorik bir de ğ i ş kene bakalım. “cinsiyet” de ğ i ş keni için de aynen yukarıdaki örnekte oldu ğ u gibi sıralama yaparak kontrol edebiliriz. Ba ş ka bir yöntem de bu de ğ i ş kenin frekans da ğ ılımına bakmak olabilir: Analyze>Descriptive Statistics>Frequencies>[“cinsiyet” de ğ i ş kenini “Variable(s)” alanına geçirelim]>ok

Hata ayıklama Cinsiyet için 16 veri girildi ğ ini, 2 adet 1 (Erkek), 10 adet 2 (Kadın), bir adet 3, bir adet 4, bir adet 11 ve bir adet te 22 girildi ğ ini görüyoruz. 11 olarak girilen verinin 1 (Erkek), 22 olarak girilen verinin de 2 (Kadın) olma ihtimali yüksektir. Bu 4 veriyi de anket numaralarını bularak kontrol etmeli, hatayı bulup düzeltmeliyiz.

Eksik veriler (missing) Eksik verilerin birkaç nedeni olabilir: 1- Birey reddetti ğ i için veri alınamamı ş tır (örne ğ in, birey alkol kullanma durumunu belirtmek istemeyebilir) 2- Bireye uygun olmadı ğ ı için veri alınamamı ş tır (örn. erkek katılımcı “do ğ um kontrol hapı kullanıyor musunuz?” sorusunu bo ş bırakacaktır) 3- Veri alınmı ş tır ama bilgisayara girilmemi ş tir (sekreter hatası). Eksik verinin sebebi ne olursa olsun istenmeyen bir durumdur. Veri eksikli ğ i olan de ğ i ş ken esas ara ş tırma konumuz (sonuç ölçütü) ise bu durum daha da ciddidir. Hatta bazı analizler yapılamaz veya sonuçların güvenilirli ğ i etkilenir.

Uç değerler Uç de ğ erler, di ğ er verilerle kar ş ıla ş tırıldı ğ ında veri setine uygun olmadı ğ ı dü ş ünülen a ş ırı de ğ erlerdir. Bu a ş ırı de ğ erler hatalı olabilece ğ i gibi gerçe ğ i de yansıtabilir. Bu nedenle hata ayıklaması yapılmalı ve do ğ rulu ğ u kontrol edilmelidir Bir bayanın 190 cm boyunda olması bir uç de ğ erdir. Ancak, nadir de olsa bu durum mümkündür. Varsa bu bireyin ya ş ve a ğ ırlık verilerine de bakarak yorum yapabiliriz.

Uç değerler Uç de ğ erlerin gerçe ğ i yansıttı ğ ına karar verdi ğ imizde bu de ğ erleri korumalıyız. Bir uç de ğ er ancak ş üpheli bulunması halinde silinmelidir. Uç de ğ erlerin fazla olması yapaca ğ ımız istatistiksel analizleri de etkileyebilir.

Uç değerler Uç de ğ erlimizin olup olmadı ğ ını verileri sıralayarak gözümüzle kontrol edebiliriz. Bir yöntem de saplı kutu grafikleri (boxplots) yaparak bakmaktır: Graphs>Legacy Dialogs>Boxplot [Simple, Summaries for groups of cases seçip Define butonuna tıklayınız]>[Y eksenine “Boy”, X eksenine “Cinsiyet” de ğ i ş kenlerini koyalım]>OK Saplı kutu grafiklerinde sap kısmının dı ş ında i ş aretlenen bireyler uç de ğ erleri temsil etmektedir.

Uç değerler SPSS’de saplı kutu grafikleri çizildi ğ inde kutunun sap kısmının dı ş ında uç de ğ erler ve a ş ırı de ğ erler de gösterilir. Veri kutudan uzaklı ğ ına göre “uç de ğ er” (outlier), veya “a ş ırı de ğ er” (extreme) olarak tanımlanır. SPSS çıktısında uç de ğ erler daire ile, a ş ırı de ğ erler ise yıldızla görülmektedir

Uç değerler

SPSS’de birden fazla de ğ i ş ken için aynı anda saplı kutu grafikleri çizdirip uç de ğ erlere bakmak mümkündür Graphs>Legacy Dialogues>Boxplot [Simple, Summaries of seperate variables seçip Define butonuna tıklayınız]>[“ya ş ”, “boy”, “kilo” de ğ i ş kenlerini “Boxes represent:” alanına geçiriniz]>OK.

Uç değerler Görüldü ğ ü üzere “Ya ş de ğ i ş keninde 3. bireyin ya ş ı (23 ya ş ında) uç de ğ er olarak, 1. bireyin ya ş ı (39 ya ş ında) a ş ırı de ğ er olarak belirtilmi ş tir. “Boy” de ğ i ş keninde de hem uç, hem de a ş ırı de ğ erler vardır. Kilo de ğ i ş keninde uç de ğ er vardır ama a ş ırı de ğ er saptanmamı ş tır.

Uç değerler Bu grafikte “age” de ğ i ş keninde 112. bireyin ya ş ı (90 ya ş ında) uç de ğ er olarak belirtilmi ş tir. “Weight” de ğ i ş keninde ise hem uç, hem de a ş ırı de ğ erler vardır. Height de ğ i ş keninde a ş ırı ve uç de ğ er saptanmamı ş tır.

Kaynak 1. Aktürk Z, Acemo ğ lu H. Sa ğ lık Çalı ş anları İ çin Ara ş tırma ve Pratik İ statistik. Anadolu Ofset: İ stanbul, 2011.