TEMEL BETİMLEYİCİ İSTATİSTİKLER

Slides:



Advertisements
Benzer bir sunumlar
EĞİTİMDE ÖLÇME & DEĞERLENDİRME -12-
Advertisements

MERKEZİ YIĞILMA (EĞİLİM) ÖLÇÜLERİ
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
Tanımlayıcı İstatistikler
Excel’de istatistik fonksiyonları
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
Tanımlayıcı İstatistikler
MERKEZİ DAĞILIM ÖLÇÜTLERİ YAYGINLIK ÖLÇÜTLERİ
Bu slayt ‘ten indirilmiştir.
KIR ÇİÇEKLERİM’ E RakamlarImIz Akhisar Koleji 1/A.
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
CAN Özel Güvenlik Eğt. Hizmetleri canozelguvenlik.com.tr.
GÖK-AY Özel Güvenlik Eğt. Hizmetleri
Tıp alanında kullanılan temel istatistiksel kavramlar
HAZIRLAYAN:SAVAŞ TURAN AKKOYUNLU İLKÖĞRETİM OKULU 2/D SINIFI
ÖLÇME VE DEĞERLENDİRME DERSİ
Uygulama I. Cinsiyet: 1: Kadın 2: Erkek Grup: 0: Kontrol 1: Hasta.
Normal Dağılım.
VERİLERİN DÜZENLENMESİ VE ORGANİZASYONU
Merkezi Eğilim (Yığılma) Ölçüleri
İstatistikte Bazı Temel Kavramlar
OLASILIK ve OLASILIK DAĞILIMLARI
Temel İstatistik Terimler
Değişkenlik Ölçüleri.
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
Ölçme sonuçları üzerinde yapılan istatiksel işlemler
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
ANA BABA TUTUMU ENVANTERİ
TANIMLAYICI İSTATİSTİKLER
Merkezi Eğilim (Yer) Ölçüleri
VERİ İŞLEME VERİ İŞLEME-4.
DEĞİŞKENLİK ÖLÇÜLERİ.
Diferansiyel Denklemler
Betimleyici İstatistik – I
Merkezi Eğilim (Yer) Ölçüleri
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
DEĞİŞKENLİK ÖLÇÜLERİ.
Uygulama I.
Asimetri ve Basıklık Ölçüleri
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Sayısal Tanımlayıcı Teknikler
ÖĞRENME AMAÇLARI Veri analizi kavramı ve sağladığı işlevleri hakkında bilgi edinmek Pazarlama araştırmalarında kullanılan istatistiksel analizlerin.
Uygulama 3.
Asimetri ve Basıklık Ölçüleri
Bölüm 03 Sayısal Tanımlama Teknikleri
Merkezi Eğilim (Yığılma) Ölçüleri
Tanımlayıcı Ölçütler Üzerinde durulan bir çalışmada amaç; elde edilen veri setini bir ya da birkaç ölçü ile özetlemektir. Kullanılan her ölçü dağılımın.

Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
ÖLÇME VE DEĞERLENDİRME DERSİ
Ölçme ve Değerlendirme
VERİLERİN DÜZENLENMESİ VE ORGANİZASYONU
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Merkezi Eğilim Ölçüleri
ANLAM ÇIKARTICI (KESTİRİMSEL) İSTATİSTİK
DEĞİŞİM ÖLÇÜLERİ.
Merkeze Yayılma Ölçüleri
DEĞİŞKENLİK ÖLÇÜLERİ.
DEĞİŞKENLİK ÖLÇÜLERİ.
Uygulama I.
Tıp Fakültesi UYGULAMA 2
ÖLÇME-DEĞERLENDİRME 8. SINIF
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
İstatistik Ders Notları.
Sunum transkripti:

TEMEL BETİMLEYİCİ İSTATİSTİKLER MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ

BETİMLEYİCİ İSTATİSTİK Betimsel istatistik istatistik bilim alaninda üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, ozetlenmesi ve analiz edililmesi ile ilgili istatistiktir. Betimsel istatistiğin çıkarımsal istatistikten veya daha uygun terimle endüktif istatistikten ana farkı betimsel istatistiğin hedefinin kantitatif sayı değerleri veya sayım veya sıralama değerleri halinde olan bir veri setini kantitatif veya grafik şekilde ifade edip özetlemek olması ve çıkarımsal istatistik gibi bu verilerin temsil ettiği kabul edilen istatistiksel anakütle karekteri hakkında kestirim veya hipotez sinaması için analitik ifadeleri elde etme hedefi olmamasıdir. Kantitatif verilerin analizi esas sonuçlarini endüktif istatistik analizleri kullanarak elde etmeye hedefli bir çalışma olsa bile, bunun yanında formel analize destek sağlamak için mutlaka betimsel istatistik araçlarının kullanılması gerekmektedir. Örneğin konuları insan davranışları olan bir formel istatistiksel analiz kapsayan bir çalışma tipik olarak tüm kapsamlı örneklem büyüklüğü, önemli altgrupların örneklem büyüklüğü, (ortalama yaş, veri konusu olarak ele alınan kişilerin erkek/kadin oranları gibi) değişik demografik, sosyal veya kliniksel karakterleri de kapsayan tablolarla birlikte verilir.

MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin aldığı değerlerin birbirinden ne kadar farklı olduğunun ölçüsüdür. En sık kullanılan merkezi eğilim ölçüleri aritmetik ortalama, tepe değer, ortanca, çeyreklikler ve geometrik ortalamadır. En sık kullanılan dağılım ölçüleri ise, değişim genişliği, çeyrek sapma, varyans, standart sapma, standart hata ve değişim katsayısıdır.

2.1. Merkezi Eğilim Ölçüleri 2.1.1. Aritmetik Ortalama   Aritmetik ortalama, en çok kullanılan merkezi eğilim ölçüsüdür. Birimlerin belirli bir değişken bakımından aldıkları değerlerin toplamının birim sayısına bölümü olarak tanımlanır. Eşit aralıklı ve oran ölçme düzeyinde ölçülen değişkenler için kullanılır. Aritmetik ortalama hem kitle hem de örneklem için hesaplanır.

Örnek: Ankara Üniversitesi Tıp Fakültesi Hastanesi kardiyoloji servisinde yatan hastaların hastanede kalış süreleri hakkında bilgi sahibi olunmak istenmektedir. Rasgele seçilen 15 hastanın hastanede kalış süreleri aşağıdaki gibi saptanmıştır. 20, 40, 10, 10, 26, 17, 17, 15, 22, 12, 12, 5, 5, 14, 15 Hastaların hastanede kalış sürelerine ilişkin aritmetik ortalamayı hesaplayınız Cevap:

Aritmetik ortalamanın özellikleri, Bir veri seti için sadece bir aritmetik ortalama vardır. Nicel verilere uygulanabilir. Birim değerlerinde meydana gelen değişim çok küçük olsa bile aritmetik ortalamayı etkiler. Aritmetik ortalama ile birim değerleri arasındaki farkların toplamı sıfırdır. Aritmetik ortalama ile birim değerleri arasındaki farkların kareleri toplamı minimum bir değerdir.

2.1.2. Tepe Değer (Mod) Bir veri grubunda en çok tekrarlanan değere tepe değer(mod) denir. Tepe değerin hesaplanmasında birimlerin büyüklük sırasına konulması şart değilse de, bu işlemin yapılması tepe değerin bulunmasında kolaylık sağlar.

Örnek: Bir grup öğrencinin ağırlıklarına ilişkin veriler sırasıyla şöyledir: 56, 57, 57, 58, 69, 69, 69, 80, 81, 82 Öğrencilerin ağırlıklarına ilişkin tepe değeri hesaplayınız. Cevap: Yukarıdaki veri gurubunda en çok tekrarlanan değer 69 olduğundan TD = 69’dur.

Tepe değerin özellikleri, Denek sayısı az olduğunda tepe değer güvenilir bir ölçü değildir. Bazı örneklemlerde bir tepe değer yerine iki ya da daha çok tepe değer olabilir. Bu durumda ya tepe değerini hesaplamaktan vazgeçilir ya da frekans tablosu tek tepe değerli bir dağılım olacak şekilde yeniden düzenlenir. Tepe değer hesaplanırken birimlerin tümü işleme katılmadığı için uç değerlerden etkilenmez. Nicel ve nitel verilerin her iki türü için de uygundur. Eğrisi J, ters J ve U şeklinde olan veriler için tepe değer kullanılmaz.

2.1.3. Ortanca (Medyan) Bir veri gurubundaki değerlerin küçükten büyüğe sıralandığında tam ortaya düşen değer ortanca değeridir. Kitledeki birimlerin sayısı çok fazla ise verilerin özetlenmesinde merkezi eğilim ölçüsü olarak ortanca kullanılabilir. Ortanca, sınıflama ölçme düzeyi ile ölçülen değişkenler için kullanılmaz. Eşit aralıklı, oran ve sıralama ölçme düzeyinde ölçülen değişkenler için kullanılır.

Örnek: Aynı hastalığa sahip 12 kişilik bir gruba yapılan ilaç tedavisi sonucu iyileşme süreleri gün olarak aşağıdaki gibi verilmiştir.

Ortancanın özellikleri, Aşırı uç değerlerden etkilenmez. Birim değerleri ile ortanca arasındaki farkın yarısı negatif yarısı pozitiftir. ∑ |Xi – ortanca|= minimum’dur.

2.1.4. Aritmetik Ortalama, Tepe Değer ve Ortanca Arasındaki İlişki Aritmetik ortalama, ortanca ve tepe değer arasındaki ilişki verilerin dağılımının çarpıklığı hakkında bilgi verir.

2.1.5. Çeyreklikler   Küçükten büyüğe doğru sıralanmış verileri dört eşit parçaya bölen değerlere çeyrek değerler denir. Birinci çeyreklik (Q1), veriler küçükten büyüğe sıralandığında verilerin %25 ini sağında, %75 ini solunda bırakan değerdir. İkinci çeyreklik ortancaya denk gelmektedir. Üçüncü çeyrek değer (Q3), veriler küçükten büyüğe sıralandığında verilerin %75 ini sağında, 22 %25 ini solunda bırakan değerdir. Yani sıralı verilerde, ortancadan küçük olan değerlerin ortancası birinci çeyrek değer, ortancadan büyük olan verilerin ortancası üçüncü çeyrek değerdir.

2.6.1. Geometrik Ortalama

Geometrik ortalamanın özellikleri, Herhangi bir veri sıfır veya negatif değerli ise geometrik ortalama hesaplanamaz. Uç değerlerden aritmetik ortalama kadar etkilenmez. Aritmetik ortalamadan küçüktür. Gözlem sonuçlarının geometrik ortalamaya oranlarının çarpımları 1 dir.

2.2. Dağılım Ölçüleri 2.2.1. Değişim Genişliği

2.2.2. Çeyrek Sapma

2.2.3. Varyans ve Standart Sapma Varyans, birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile elde edilir. Varyans gözlem sonuçlarının aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya koyan bir dağılım ölçüsüdür. Kitle varyansı , örneklem varyansı ile gösterilir. Standart sapma varyansın kareköküdür. Kitle standart sapması , örneklem standart sapması s ile gösterilir.

2.2.4. Standart Hata

2.2.5. Değişim Katsayısı

2.2.6. Çarpıklık (Skewness) Bir dağılımın normal dağılıma göre simetrik ya da çarpık olup olmadığını belirten bir ölçüdür. a3 ile gösterilir. Simetrik (normal) dağılımda a3 değeri 0 (sıfır)’dır. Gözlemsel dağılım simetrik ise çarpıklık ölçüşünün sıfıra eşit ya da çok yakın olması gerekir. Pozitif çarpıklık küçük değerlerin fazlalıkta olduğunu, negatif çarpıklık ise büyük değerlerin fazlalıkta olduğunu gösterir. Herhangi bir veri setinde ortalamanın medyandan büyük olması durumunda sağa çarpık dağılım, ortalamanın medyandan küçük olması durumunda sola çarpık dağılım ortaya çıkar.

2.2.7. Basıklık (Kurtosis) Basıklık dağılımın “dikliğini” veya “düzgünlüğünün” yani verilerin tepe noktalarının durumu hakkında bilgi veren ölçüttür. Sıfıra yakın bir basıklık normal dağılıma yakın bir şekli oluşturur. Basıklık için pozitif bir değer ise normalden daha dik bir dağılıma işarettir. Negatif bir basıklık değeri ise normalden daha düz bir dağılıma işarettir.

SPSS Analyse Menüsü İstatistiksel analiz yöntemlerini uygulamak için kullanılan bir menüdür.

1- Reports: Analyze menüsünün bir alt menüsü olan Reports ile veri setinde yer alan satır (Report Summaries in Rows), sütun (Report Summaries in Columns) ya da tümüne (Case Summaries) ilişkin kısa rapor içeriğinde tanımlayıcı istatistikler hesaplanır.  

OLAP Cubes: Seçilen değişkenlerin istatistiksel işlemlerini yapar. Case summaries: Verilerin frekans ve çapraz tablolarının oluşturulması, belirtici istatistiklerin hesaplanması, grafik çizimi ve raporlanmasını sağlar. Report Summaries in Row: Sıralara ilişkin özet istatistikler hesaplar. Report Summaries in Column: Değişkenlerle ilgili özet istatistikler hesaplar.

2- Descriptive Statistics: Analyze menüsünün bir alt menüsü olan Descriptive Statistics ile veri setine ilişkin frekans tablosu, tanımlayıcı istatistikler, grafikler ve çapraz tablolar (Frequencies, Descriptive Statistics, Explore, Crosstabs) oluşturulur.

Frequencies: Verilerin frekans tablosunu, belirtici istatistikleri, dağılım ölçülerini hesaplar ve grafiklerini çizer. Descriptives: Verilerin belirtici istatistiklerini ve asimetrik dağılım ölçüleri olan çarpıklık (kurtosis), basıklık (skewnes) ölçülerini hesaplar. Explore: Tüm birimlerin yada her bir gruptaki birimlerin belirtici istatistiklerini hesaplar ve yayılım grafiklerini çizer. Bir değişkenin diğer değişkene göre istatistiklerini bulur. Crosstabs: İki yada daha fazla değişkenin ikili çapraz tablolarını düzenler. Hazırlanan tablolara testler yapılır ve özet istatistikler bulunur. Sayısal değişkenler kodlama ile az sayıdaki gruba bölünerek çapraz tablolar düzenlenir.  

TRANSFORM MENÜSÜ Veri dosyasındaki değişkenlerden yeni değişkenler türetmek, dönüşüm işlemlerini gerçekleştirmek için kullanılan bir menüdür.  

1) Compute Compute alt menüsünde, nümerik ve string değişkenler için hesaplamalar yapılarak tüm birimler için yeni değişkenler oluturulabilir ya da varolan bir değişkenin değerleri değiştirilebilir. Mantıksal koşullar altında verinin alt grupları için hesaplamalar yapılabilir. Aritmetik fonksiyonlar, istatistiksel fonksiyonlar, dağılım fonksiyonları ve string fonksiyonları ile 70’in üzerinde farklı fonksiyon oluşturulabilir. 2) Count Her bir birim için iki ya da daha fazla değişkende aynı değer veya değerlere sahip gözlemlerin sayılmasını sağlar.

3) Recode Recode alt menüsündeki Into Same Variables alt menüsü, bir değişkenin belirlenen aralıktaki değerlerinin yeni kod değerlerine dönüştürülmesini ve bu kod değerlerinin aynı değişken üzerine yazdırılmasını sağlar. Into Different Variables alt menüsü, bir değişkenin belirlenen aralıktaki değerlerinin yeni kod değerlerine dönüştürülmesini ve bu kod değerlerinin farklı bir değişken olarak yazdırılmasını sağlar.

Uygulama : YTÜ İstatistik bölümü öğrencilerinden SPSS dersini alan 20 öğrencinin vize ve final notları aşağıdaki gibidir. Merkezi eğilim ve dağılım ölçülerini hesaplayınız. Vize 90,00 21,00 60,00 22,00 20,00 80,00 100,00 30,00 15,00 70,00 45,00 50,00 24,00 65,00 Final 20,00 27,00 75,00 60,00 80,00 40,00 50,00 70,00 90,00 77,00 10,00 45,00 25,00 85,00

1) Merkezi Eğilim Ölçülerinin Bulunması

20 öğrencinin aldığı final notlarının ortalaması 48’dir.

Mean > Median > Mod 20 öğrencinin final notuna ilişkin ortanca değer 47’dir. Tepe değeri 20’dir. Bunun anlamı 20’ye yakın not alan öğrencilerin sayısının fazla olmasıdır. Mean > Median > Mod Yönlü Eğimli

Geometrik Ortalamanın bulunması:

Geometrik Ortalamanın bulunması:

Yapılan işlemler sonucu aşağıdaki çıktıya ulaşılır. Geometrik Ortalama (40,87) < Aritmetik Ortalama (48,45)

2) Dağılım Ölçülerinin Bulunması

Dağılım Genişliği ve Maximum, Minimum Değerlerinin çıktıları aşağıdaki gibidir. Değişim Genişliği = Max – Min Final sınavından alınan en yüksek not 90 en düşük not ise 10’dur.

Standart Sapma, Varyans ve Standart Hata bulunması.

Standart Hata, Standart Sapma ve Varyans Değerlerinin çıktıları aşağıdaki gibidir. Standart sapma 26,142 bulunmuştur. Buradan 20 öğrencinin finalden aldıkları notlar arasındaki farklılığın fazla olduğunu söyleyebiliriz.

Basıklık ve Çarpıklığın Ölçülmesi Analyze  Descriptives Statistics  Frequencies Skewness (Çarpıklık Katsayısı) Kurtosis (Basıklık Katsayısı)

Basıklık Katsayısı : - 1,540 Çarpıklık Katsayısı : 0,161 Dağılım standart normal dağılıma uygun değildir. Uygun olması için her iki katsayının 0’a eşit olması gerekirdi. Basıklık katsayısı 0’dan küçük (negatif değerli) ise dağılım basıktır. Çarpıklık katsayısı 0’dan büyük (pozitif değerli) ise dağılım + yöne eğimli ve sağa çarpıktır.

SORU : 92 kişiden ölçülen sistolik kan basınçları aşağıda verilmiştir SORU : 92 kişiden ölçülen sistolik kan basınçları aşağıda verilmiştir. Bu verileri bilgisayara girerek istenilenleri bulunuz. 120 124 200 65 101 114 116 98 154 140 120 80 114 122 165 190 166 152 135 123 143 119 111 100 147 112 111 114 154 99 178 107 97 68 122 105 99 65 154 124 189 174 157 164 144 113 90 110 86 186 106 200 199 146 167 156 197 67 86 115 69 156 110 95 108 180 146 98 95 130 105 120 112 154 160 141 125 196 146 165 125 98 118 130 79 178 166 80 73 84 88 85 a) Aritmetik ortalama (mean), ortanca değer (median), en küçük değer (min), en büyük değer (max), değişim aralığı (range), standart sapma (standard deviation), standart hata (standart error of mean) değerlerini bulunuz. b) Çarpıklık katsayısı (skewness)’ nı bularak çarpıklığın şeklini belirleyiniz. c) Basıklık katsayısı (kurtosis)’nı bularak eğrinin basık mı yoksa sivri mi olduğunu belirleyiniz.

1-) Ortalama , ortanca ve tepe değeri hakkında kısaca bilgi veriniz ve SPSS ‘de bunların bulunmasını sağlayan adımları yazınız . Cevap : Ortalama , Birimlerin belirli bir değişken bakımından aldıkları değerlerin toplamının birim sayısına bölümü olarak tanımlanır. Ortanca , Bir veri gurubundaki değerlerin küçükten büyüğe sıralandığında tam ortaya düşen değer ortanca değeridir. Tepe Değeri , Bir veri grubunda en çok tekrarlanan değere tepe değer(mod) denir. SPSS’de veriler girildikten sonra sırasıyla şunlar yapılır : Analyze sekmesinden descriptive statistics , oradan da frequencies tıklanır . Çıkan ekranda mean,median ve mode seçilerek continue kutusuna tıklanır . 2-) Std. Hata , Std. Sapma ve Varyans konusunda kısaca bilgi verip SPSS ‘de yapılması gereken adımları söyleyiniz . Cevap : Varyans, birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile elde edilir. Standart sapma varyansın kareköküdür Standart hata, örneklem aritmetik ortalamasının hatasını ifade eder. SPSS de Analyze sekmesinden descriptive statistics , oradan da frequencies tıklanır . Çıkan ekranda varianca , std. error ve std. deviation kutucukları işaretlendikten sonra continue ‘ya basılır .   3-)Analyse menüsü ve descriptive statistics sekmesini kısaca anlatınız . Cevap : Analyse menüsü istatistiksel analiz yöntemlerini uygulamak için kullanılan bir menüdür . Desciriptive statistics ise verilerin frekans tablosunu, belirtici istatistikleri, dağılım ölçülerini hesaplayıp grafiklerini çizmemizi ve çapraz tablo oluşturmamızı sağlar .