VERİLERİN ANALİZİ Öğr. Gör. Funda Veren
Analizlerde seçilecek yöntemler tanımlanan verilerin niteliğine göre yapılacağından, doğru sonuçlara ulaşmak için verilerin tanımlanması önemlidir Nesnel olarak ölçülebilen, herkesin üzerinde anlaştığı standart ölçü birimleri olan gözlemcinin yargı ve yorumuna göre değişmeyen verilerdir (cinsiyet, yaş, kan biyokimyası vb) Somut veriler Gözlemciye özgü yargı ve yorumlara bağlı, doğrudan gözlenemeyen ve ölçülemeyen, standart ölçü birimi olmayan ayrıca bir yorumu gerektiren verilerdir. Soyut veriler
Standart ölçü birimleri olan,doğrudan ya da dolaylı yöntemlerle ölçülerek elde edilen verilere denir. Bunlara nicel /parametrik değişkenler de denir. Bu tür veriler hem aynı bireyde , hem de farklı bireylerde gözlemden gözleme değişen ve farklı sonuçlar veren büyüklüktedir. (yaş, kilo, boy, kan biyokimyası vb) Sürekli değişken (interval veri)
Doğrudan ölçülemeyen, sadece söz ve kelimelerle tanımlanabilen verilere kesikli özellik denir. Birimlerle ifade edilir, parçalanamaz, alt birimlendirme yapılamaz, alt ve üst sınırlardan başka değer alamaz. Bu tür verilere bu nedenle süreksi değişken denilir. (cinsiyet, ırk, medeni durum, tat, koku Süreksiz değişken (nominal veri)
Genellikle bireyin kontrolü dışında birçok faktörün etkisi ile meydana gelebilen, bu faktörlerle kendisi arasındaki ilişkinin derecesi, yönü saptanmaya çalışılan değişkendir. ( kan basıncı) Bağımlı değişken Genellikle kontrol edilemeyen, istendiği zaman değiştirilemeyen, bağımlı değişkeni ne ölçüde etkilemeye çalıştıkları saptanmaya çalışılan değişkenlerdir. (yaş, sigara içme, cinsiyet vb) Bağımsız değişken Gruplar azdan çoğa, hafiften şiddetliye doğrudur. sosyal sınıfın üst, orta ve alt sınıf olarak sınıflandırılması örnek olarak verilebilir Ordinal veri
VERİLERİN KODLANMASI VE SINIFLANDIRILMASI İstatistiksel analizlere başlanmadan önce veriler özellikleri yönünden gözden geçirilmeli ve aşağıdaki sıra izlenmelidir. Nominal ve ordinal veriler sınıflanmalı Veriler veri tabanına bigisayara/kağıda girilmeli Veri girişi sırasında yapılan hatalar açısından veri tabanı kontrol edil Verilerin tanımlayıcı istatistiği yapılmalı Gerekirse verilere dönüşüm uygulanmalı Çalışma amacına ve verilerin özelliklerine uygun istatistiksel analiz yap Analiz sonuçları yorumlanmalı
Anket yöntemi ile veya kayıt formları ile elde edilen verilerin analize hazırlanması için önce kodlanması gerekir. Verilerin bilgisayara kaydedilmesi için önce verilerin kodlanması, yani sayısal sembollere dönüştürülmesi, her bir değişken için kaç kolon gerektiği, hangi rakamın neyi ifade ettiği belirlenir Bunu açıklayan kodlama yönergesi hazırlanır Veriler SPSS yazılımında kurallara uygun yazılır.
SPSS DE VERİ GİRİŞİ Nominal değişkenlerde olumlu değişkenler 1, olumsuzlar ise 0 yazılarak kodlanır Var:1 yok: 0 evet:1 hayır:0 Ordinal değişkenlerde değişkenlerin düzeyine göre sınıflama yapılır Çok kötü, kötü, fena değil, iyi, çok iyi: 0 1 2 3 4 Değişkenleri kodlarken pratik açıdan aynı kodlama sistemine uyulmalıdır. 0,1,2…….1,2,3 yerine tümünün 0,1,2 şeklinde kodlanması
İSTATİSTİKSEL ANALİZ Veriler için hangi istatistiksel testin uygun olduğuna karar vermek için aşağıdaki sorulara yanıt aranmalıdır? Kaç tane değişken var? Kaç tanesi kullanılıyor? Değişkenler nasıl ölçülecek? (Sıralı mı? Sayısal mı?) Değişkenler doğru seçilmiş mi? Kaç grup var? ( Bağımlı? Bağımsız?) Ne ölçülmek isteniyor? (Gruplar arası fark mı? Değişkenler arası fark mı? İlişki mi?)
DEĞİŞKENLER NASIL ÖLÇÜLÜR???? KIYAS PARAMETRİK NON-PARAMETRİK Toplum- örneklem Z(t) İşaret testi İki örnek grubun kıyaslaması Student t testi (1. veya 2. tip) Mann Whitney U Eşlendirilmiş dizi Student t testi Wilcoxon 2’den fazla örneklem ANOVA Kruskall-Wallis
T TESTİ İki grubun aritmetik ortalamaları karşılaştırılır Parametrik bir testtir Gruplar birbirinden bağımsız olmalıdır Veri, ölçümle belirtilen değişken olmalıdır Her gruptaki denek sayısı en az 30 olmalıdır Her gruptaki denek sayısı birbirine eşit ya da yakın olmalıdır Parametrik test varsayımları yerine getirilemiyorsa MANN WHİTNEY U kullanılır Eşlendirilmiş dizilerde WILCOXON uygulanır
VARYANS ANALİZİ Karşılaştırılacak gruplar birbirine benzer olmalıdır Parametrik test varsayımları yerine getirmelidir. Gruplar birbirinden bağımsız olmalıdır Gruplardaki denek sayıları 30’dan az olmamalıdır Gruplardaki denek sayıları biribirine eşit ya da yakın olmalıdır Analizin tek yönlü mü çift yönlü mü olduğu dikkate alınarak uygun yöntem seçilmelidir. Parametrik test varsayımları yerine getirilemiyorsa KRUSKAL WALLİS uygulanır.
İŞARET TESTİ Evren ortancasının belli bir değere eşit olup olmadığının test edilmesinde kullanılır. Denek sayısının 25’den az ya da fazla olmasına göre ayrı testler uygulanır.
İŞARET TESTİ İŞARET TESTİ Bir iş güvenliği müfettişi, bir aylık süre içinde bir işyerinde olan iş kazalarının sayısının ortancasını 8 olarak bulmuştur. İş yeri sahibine gerekli önlemleri alması için önerilerde bulunduktan iki ay sonra yapılan incelemede ikinci ayın kaza ortancası ile ilk ayın kaza ortancası arasındaki fark işaret testi ile değerlendirilmiştir
MANN WHİTNEY U İki dağılımın eşit olup olmadığını karşılaştıran nonparametrik testtir. Denek sayısı 30’dan az ise bu test kullanılır. Gruplardaki denek sayısı 20’den az ise U değeri hesaplanır. Denek sayısı 20’den fazla ise Z değeri hesaplanır.
Kİ-KARE Gözlenen frekanslar ile beklenen frekanslar arasındaki farkın anlamlı olup olmadığını test etmek için kullanılır. Niteliksel olarak belirtilen veriler kullanılır. Ölçümle belirtildiği halde sonradan nitel verilere dönüştürülen verilerde de uygulanır 2X2 düzeninde 5’den küçük değer olduğunda Fisher’in kesin ki-kare Testi uygulanır nX2 düzeninde 5’den küçük değer olduğunda Kolmogov Smirnov testi uygulanır
KORELASYON TESTİ İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönü ve gücü belirlenir İki değişken arasında pozitif ilişki varlığı, biri artarken diğeri de artar. İki değişken arasında negatif ilişki, biri artarken diğeri azalır. İki değişken arasında ilişki olmaz, tamamen bağımsızdırlar.
BAĞINTI KATSAYISI (r) ANLAMI 0-0.25 Hiç ilişki yok ya da çok zayıf ilişki 0.25-0.50 Zayıf-orta derecede ilişki 0.50-0.75 İyi derecede ilişki 0.75-1.00 Çok iyi derecede ilişki