VERİLERİN DÜZENLENMESİ VE ORGANİZASYONU

Slides:



Advertisements
Benzer bir sunumlar
Çıkarımsal İstatistik
Advertisements

TEMEL BETİMLEYİCİ İSTATİSTİKLER
BENZETİM Prof.Dr.Berna Dengiz 8. Ders.
Analysis of Variance/Multiple ANOVA
KOVARYANS ANALİZİ (ANCOVA)
Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ
Kİ-KARE TESTİ Uygulama amacına ve durumuna göre Ki-Kare Testi üç başlık altında incelenir; Ki-Kare Uygunluk Testi Ki-Kare Bağımsızlık Testi Ki-Kare Homojenlik.
Yrd. Doç. Dr. Kemal DOYMUŞ K.K.E.F İlköğretim Bölümü
İSTATİSTİK VE OLASILIK I
Standart Normal Dağılım
Excel’de istatistik fonksiyonları
Tanımlayıcı İstatistikler
Tıp alanında kullanılan temel istatistiksel kavramlar
1. İki Yönlü ANOVA İki bağımsız değişkenin bir bağımlı değişken üzerine etkisini araştırırken bağımsız değişkenlerin bağımlı değişken üzerine etkilerini.
Normal Dağılım.
İstatistikte Bazı Temel Kavramlar
OLASILIK ve OLASILIK DAĞILIMLARI
Değişkenlik Ölçüleri.
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
SÜREKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK YOĞUNLUK FONKSİYONLARI
OLASILIK ve KURAMSAL DAĞILIMLAR
TANIMLAYICI İSTATİSTİKLER
TEK YÖNLÜ MANOVA Birden fazla bağımlı değişkene tek bir bağımsız değişkenin etki ettiği durumlarda Tek Yönlü MANOVA kullanılır. Tek yönlü MANOVA da başlangıç.
Kİ-KARE TESTİ Uygulama amacına ve durumuna göre Ki-Kare Testi üç başlık altında incelenir; Ki-Kare Uygunluk Testi Ki-Kare Bağımsızlık Testi Ki-Kare Homojenlik.
Betimleyici İstatistik – I
VARYANS ANALİZİ Varyans analizi iki yada daha fazla ortalama arasında fark olup olmadığı ile ilgili hipotezi test etmek için kullanılır. Varyans analizinde.
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
İKİ YÖNLÜ MANOVA Birden fazla bağımlı değişkene iki bağımsız değişkenin etki ettiği durumlarda Çift Yönlü MANOVA kullanılır. Çift yönlü MANOVA da başlangıç.
DEĞİŞKENLİK ÖLÇÜLERİ.
SÜREKLİ ŞANS DEĞİŞKENLERİ
Uygulama I.
Örneklem Dağılışları.
Asimetri ve Basıklık Ölçüleri
Sıklık Tabloları ve Tek Değişkenli Grafikler
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Sayısal Tanımlayıcı Teknikler
Olasılık Dağılımları ve Kuramsal Dağılışlar
Uygulama 3.
Maliye’de SPSS Uygulamaları Doç. Dr. Aykut Hamit Turan SAÜ İİBF/ Maliye Bölümü.
Örneklem Dağılışları ve Standart Hata
Asimetri ve Basıklık Ölçüleri
Bölüm 03 Sayısal Tanımlama Teknikleri
Maliye’de SPSS Uygulamaları
Tanımlayıcı Ölçütler Üzerinde durulan bir çalışmada amaç; elde edilen veri setini bir ya da birkaç ölçü ile özetlemektir. Kullanılan her ölçü dağılımın.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
NON-PARAMETRİK TESTLER Doç. Dr. Kemal DOYMUŞ K.K.E.F İlköğretim Bölümü.
ÖLÇME VE DEĞERLENDİRME DERSİ
VERİLERİN DÜZENLENMESİ VE ORGANİZASYONU
ARAŞTIRMA YÖNTEM ve TEKNİKLERİ
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Merkezi Eğilim Ölçüleri
spssasistan.com (Doğru, Hızlı, Güvenilir Analiz)
DEĞİŞİM ÖLÇÜLERİ.
Numerik Veri Tek Grup Prof. Dr. Hamit ACEMOĞLU.
İstatistiksel Analizler
SPSS Uygulamaları Parametrik İstatistik
Merkeze Yayılma Ölçüleri
DEĞİŞKENLİK ÖLÇÜLERİ.
Temel İstatistik Terimler
DEĞİŞKENLİK ÖLÇÜLERİ.
VARYANS ANALİZİ Varyans analizi iki yada daha fazla ortalama arasında fark olup olmadığı ile ilgili hipotezi test etmek için kullanılır. Varyans analizinde.
Uygulama I.
Tıp Fakültesi UYGULAMA 2
ÖLÇME-DEĞERLENDİRME 8. SINIF
ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
2.Hafta Dağılım İç tutarlılık Tek Örneklem t Testi
Temel İstatistik Terimler
Sunum transkripti:

VERİLERİN DÜZENLENMESİ VE ORGANİZASYONU İstatistik analizlere başlamadan önce yapılması gereken ilk iş verilerin düzenlenmesi olmalıdır. İstatistiksel çalışmalarda pek çok analizi uygulayabilmek için verilerin dağılımının normal yada normale yakın olması gerekir. Verilerin dağılımı; histogram, saplı kutu grafiği, detrented normallik grafiği ve dal yaprak gibi grafikler kullanılarak gösterilebilir. Ayrıca Kolmogorav Smirnow ve Shapiro Wilks testleride kullanılabilir.

Descriptive Statistics Örnek Uygulama: Bağımlı değişken kimya puanı ve bağımsız değişken bölüm kullanılarak verilerin dağılımının gösterimi Analyze Descriptive Statistics Explore Aşağıdaki ekran görülür

Bağımlı değişken Bağımsız değişken 1 2 Aşağıdaki ekran açılır

Alttaki işleme geçiniz işaretlenir basılır Alttaki işleme geçiniz

Ve…. Continue butonuna basılır Artık çıktıları yorumlamaya geçebiliriz işaretle Ve…. Continue butonuna basılır Artık çıktıları yorumlamaya geçebiliriz Şimdi öğrendiklerimizi uygulayalım

Tanımlayıcı istatistikler Ortalama Güven aralığı Ortanca Standart sapma Çarpıklık Basıklık

Mean (Ortalama): Gözlem sonuçlarının toplamının gözlem sayısına bölümüdür. Her bir gözlem değerinin ortalamadan sapmalarının toplamı gözlem sayısına bölünürse ve karekökü alınırsa Standart Sapma bulunur. Standart sapmanın karesi varyansı verir. Tahmini yapılacak büyüklüğün arasında kalacağı alanın hesaplanmasına Güven Aralığı denir. Seriyi iki eşit parçaya bölen değer Ortanca (Medyan) dır.

İstatistik çalışmalarında en yaygın kullanılan dağılım Normal Dağılımdır. Normal dağılım simetriktir. Şekli çan eğrisine benzer. Simetrik bir dağılımın tepe değeri (Mod), ortancası (Medyan) ve Ortalaması birbirine eşittir. Basıklık (Kurtosis) ve Çarpıklık (Skewness) değerleri verilerin normal dağılım gösterip göstermediğini ifade eder. Çarpıklık veri dağılımının normalden uzaklaşarak sağa ve ya sola doğru meyleden yamuk bir şekil almasını ifade eden bir kavramdır. Normal bir dağılımda çarpıklık katsayısı “sıfır” olacaktır. Çarpıklık arttıkça mod ve ortalama birbirinden uzaklaşır.

Çarpıklık katsayısı – sonsuz ile + sonsuz arasında değerler alabilmektedir. Pozitif ve Negatif olmak üzere iki tir çarpıklıktan söz edilebilir. Eğer ortalama medyandan küçük ise dağılım sola (negatif) çarpık olur. Eğer ortalama medyandan büyük ise dağılım sağa (pozitif) çarpık olur. Çarpıklık ölçüsü ± 3 (±2 de olabilir) aralığında değerler alması durumunda normal kabul edilmektedir.

Analiz çıktısından elde edilen tanımlayıcı istatistikler tablosundaki Skewnwss’e ait statistic değeri Std. Error değerine bölünerek bulunan değer çarpıklık değeridir. Bu değer % 5 anlamlılık düzeyinde +1,96 ve -1,96 değerleri arasında ise veriler normale yakındır denilebilir. Bu değerin pozitif çıkması verilerin sağa çarpık, negatif çıkması ise sola çarpık olduğunu gösterir.

Basıklık (Kurtosis) normal dağılım eğrisinin ne kadar dik ve ya basık olduğunu gösterir. Tam çan eğrisinin basıklık katsayısı “sıfır”dır. Basıklık katsayısı pozitif ise, eğri normale göre daha diktir. Negatif ise normale göre daha basıktır. Analiz çıktısından elde edilen tanımlayıcı istatistikler tablosundaki Kurtosis’e ait statistic değeri Std. Error değerine bölünerek bulunan değer % 5 anlamlılık düzeyinde +1,96 ve -1,96 değerleri arasında ise dik olmadığı söylenebilir.

Histogram Historam çizimleri verilerin ne kadar sıklıkla tekrar edildiğini gösteren grafiklerdir. Yandaki histogram eğrisine bakıldığında eğrinin tam simetrik olmadığı sola çarpık olduğu görülmektedir.

Normal İhtimal Grafiği Bu grafikte verilerin gözlenen ve beklenen değerleri gösterilir. Eğer üzerinde çalışılan örneklem normal dağılıma sahip ise değerlerin bir doğru üzerinde ve ya etrafında toplanması gerekir. Yandaki şekilde veriler bir doğru üzerinde toplandığı için veri grubunun normale yakın olduğunu söğleyebiliriz.

Trendsiz normallik grafiği Bir veri grubu normal dağılım gösteriyorsa değerlerin sıfır çizgisinden sapmalarının gösterildiği bu grafikte beklenen noktaların dikey eksendeki “0” dan çizilen yatay çizgi etrafında bir fonksiyon biçimini oluşturmadan, rasgele dağılması beklenir. Bu veriler normale yakın dağılmıştır

Saplı kutu grafiği Kutu grafiği yüzdeliklere dayanan tanımlayıcı istatistikleri kullanır. Şeklin uzunluğu çeyreklikler arasındaki aralıktır. Kutu dağılımın %50’sinin merkezi eğilimi ve yaygınlığı ile ilgili bilgi verir. Eğer ortanca çizgisi merkezin altında ise dağılım pozitif çarpık, üstünde ise negatif çarpıktır. Tam ortada yer alması dağılımın normal olduğunu göstermektedir. Sola çarpık (negatif) dağılımı ifade etmektedir

EKSİK VERİLERİN İNCELENMESİ Her analizde eksi verilerle karşılaşabiliriz. Bir ankette kişi soruyu cevapsız bırakabilir… bazı değişkenlerle ilgili gözlem değerlerine ulaşamayabiliriz…. O halde Ne yapmamız gerekir? Bu durumda Eksik verilerin gözlemlere rasgele mi saçıldığı yoksa belirgin bir yapı mı oluşturduğu, Eksik verilerin ne kadar sıklıkla karşımıza çıktığının araştırılması gerekir.

Eksik veriye yol açan gözlemleri veri grubundan çıkarma yoluna gitmeyiniz. Gözlem sayınız önemli derecede etkilenebilir. O zaman…. Veriye yeni gözlem değerleri eklenebilir, Verideki eksik değerler çeşitli istatistiksel yaklaşımlarla giderilmeye çalışılır.

İşaretlenince Missing Value Analysis penceresi açılır. Eksik verileri incelemek için Seçilir İşaretlenir İşaretlenince Missing Value Analysis penceresi açılır.

Bütün değişkenler Quantitative Variables bölümüne aktarılır.

1. Adım; çünkü gözlem sayısı eksik gözlem sayısından daha fazladır.

Değişkenler aktarılır 2. Adım (Patterns) Seçilir İşaretlenir Değişkenler aktarılır

3. Adım (Descriptives) Seçilir Hepsi işaretlenir

En son pencerede “OK” işaretlendikten sonra analiz çıkıları ekranı gelir. Buraya kadar yaptığımız işlemler sonucunda elde ettiğimiz tablolardan eksik verilerin yapısı, rasgelelik olup olmadığı, eksik verilerin toplam verilere etkisi tespit edilebilir. Separate Variance t Test Rasgelelik durumu t testi tablosundaki P(2-tail) Değeri %5 den büyük ise eksik verilerde rasgelelik vardır.

Listwise Correlation Rasgelelik durumu korelasyon matrisindeki korelasyon değerleri yüksek değil ise eksik verilerde rasgelelik vardır. Summary of Estimated Mean Tahmini ortalamalar tablosundaki Listwise bölümünde sadece tam olan gözlemlere ait ortalamalar, All values bölümünde ise eksik verilerin olduğu gözlemlerde dahil tüm gözlemlere ait ortalamalar hesaplanmıştır. Bu değerlerin karşılaştırılması ile farklılık olup olmadığını ve eksik verilerde rasgelelik olup olmadığı anlaşılabilir.

Data Patterns (all cases) Eksik ve tam gözlem sayıları tablosundan eksik verilerin sayısı ve eksik verinin hangi gözlemin hangi değişkeninde olduğu görülebilir. Bu tabloda eksik veriler “S” ile gösterilir. Missing Patterns (cases with missing values) Eksik veri yapısı tablosu ve Tabulated Pattern tablolaştırılmış eksik veri yapıları tablosundan eksik verilerin yapısı, sayısı ve tam gözlem sayısını etkileme durumunu inceleyebiliriz. Bunları bir örnek üzerinde görelim

EKSİK VERİLERİN TAMAMLANMASI Burada eksik verileri çıkartmadan nasıl analize koyabiliriz? Sorusunun cevabı arayacağız. Transform Replace Missing Values Komutlarını uygulayınız….. Aşağıdaki diyalog penceresi açılır.

Method kısmından herhangi bir metod seçilir sonra tüm değişkenler New Variable(s) kısmına aktarılır. Ve “OK” butonuna basılır.

Serinin ortalamasını alarak eksik verilerin yerine koyar Eksik değerin altındaki ve üstündeki tam verilerin ortalamasını alarak eksik verinin yerine koyar Eksik değerin altındaki ve üstündeki tam veriler kullanılır Eksik değerin altındaki ve üstündeki tam verilerden yararlanarak bir medyan değeri hesaplar eksik verinin yerine koyar Mevcut seriler 1’den n’e kadar ölçeklendirilmiş bir endeks değişkeninde eksik veriler öngörülen değerlerine göre yerleştirilir

Eksik veriler tamamlanmadan önceki durum

Eksik veriler tamamlandıktan sonraki durum