Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

TEMEL BETİMLEYİCİ İSTATİSTİKLER

Benzer bir sunumlar


... konulu sunumlar: "TEMEL BETİMLEYİCİ İSTATİSTİKLER"— Sunum transkripti:

1 TEMEL BETİMLEYİCİ İSTATİSTİKLER
MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ

2 BETİMLEYİCİ İSTATİSTİK
Betimsel istatistik istatistik bilim alaninda üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, ozetlenmesi ve analiz edililmesi ile ilgili istatistiktir. Betimsel istatistiğin çıkarımsal istatistikten veya daha uygun terimle endüktif istatistikten ana farkı betimsel istatistiğin hedefinin kantitatif sayı değerleri veya sayım veya sıralama değerleri halinde olan bir veri setini kantitatif veya grafik şekilde ifade edip özetlemek olması ve çıkarımsal istatistik gibi bu verilerin temsil ettiği kabul edilen istatistiksel anakütle karekteri hakkında kestirim veya hipotez sinaması için analitik ifadeleri elde etme hedefi olmamasıdir. Kantitatif verilerin analizi esas sonuçlarini endüktif istatistik analizleri kullanarak elde etmeye hedefli bir çalışma olsa bile, bunun yanında formel analize destek sağlamak için mutlaka betimsel istatistik araçlarının kullanılması gerekmektedir. Örneğin konuları insan davranışları olan bir formel istatistiksel analiz kapsayan bir çalışma tipik olarak tüm kapsamlı örneklem büyüklüğü, önemli altgrupların örneklem büyüklüğü, (ortalama yaş, veri konusu olarak ele alınan kişilerin erkek/kadin oranları gibi) değişik demografik, sosyal veya kliniksel karakterleri de kapsayan tablolarla birlikte verilir.

3 MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ
Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin aldığı değerlerin birbirinden ne kadar farklı olduğunun ölçüsüdür. En sık kullanılan merkezi eğilim ölçüleri aritmetik ortalama, tepe değer, ortanca, çeyreklikler ve geometrik ortalamadır. En sık kullanılan dağılım ölçüleri ise, değişim genişliği, çeyrek sapma, varyans, standart sapma, standart hata ve değişim katsayısıdır.

4 2.1. Merkezi Eğilim Ölçüleri
Aritmetik Ortalama Aritmetik ortalama, en çok kullanılan merkezi eğilim ölçüsüdür. Birimlerin belirli bir değişken bakımından aldıkları değerlerin toplamının birim sayısına bölümü olarak tanımlanır. Eşit aralıklı ve oran ölçme düzeyinde ölçülen değişkenler için kullanılır. Aritmetik ortalama hem kitle hem de örneklem için hesaplanır.

5 Örnek: Ankara Üniversitesi Tıp Fakültesi Hastanesi kardiyoloji servisinde yatan hastaların hastanede kalış süreleri hakkında bilgi sahibi olunmak istenmektedir. Rasgele seçilen 15 hastanın hastanede kalış süreleri aşağıdaki gibi saptanmıştır. 20, 40, 10, 10, 26, 17, 17, 15, 22, 12, 12, 5, 5, 14, 15 Hastaların hastanede kalış sürelerine ilişkin aritmetik ortalamayı hesaplayınız Cevap:

6 Aritmetik ortalamanın özellikleri,
Bir veri seti için sadece bir aritmetik ortalama vardır. Nicel verilere uygulanabilir. Birim değerlerinde meydana gelen değişim çok küçük olsa bile aritmetik ortalamayı etkiler. Aritmetik ortalama ile birim değerleri arasındaki farkların toplamı sıfırdır. Aritmetik ortalama ile birim değerleri arasındaki farkların kareleri toplamı minimum bir değerdir.

7 Tepe Değer (Mod) Bir veri grubunda en çok tekrarlanan değere tepe değer(mod) denir. Tepe değerin hesaplanmasında birimlerin büyüklük sırasına konulması şart değilse de, bu işlemin yapılması tepe değerin bulunmasında kolaylık sağlar.

8 Örnek: Bir grup öğrencinin ağırlıklarına ilişkin veriler sırasıyla şöyledir: 56, 57, 57, 58, 69, 69, 69, 80, 81, 82 Öğrencilerin ağırlıklarına ilişkin tepe değeri hesaplayınız. Cevap: Yukarıdaki veri gurubunda en çok tekrarlanan değer 69 olduğundan TD = 69’dur.

9 Tepe değerin özellikleri,
Denek sayısı az olduğunda tepe değer güvenilir bir ölçü değildir. Bazı örneklemlerde bir tepe değer yerine iki ya da daha çok tepe değer olabilir. Bu durumda ya tepe değerini hesaplamaktan vazgeçilir ya da frekans tablosu tek tepe değerli bir dağılım olacak şekilde yeniden düzenlenir. Tepe değer hesaplanırken birimlerin tümü işleme katılmadığı için uç değerlerden etkilenmez. Nicel ve nitel verilerin her iki türü için de uygundur. Eğrisi J, ters J ve U şeklinde olan veriler için tepe değer kullanılmaz.

10 Ortanca (Medyan) Bir veri gurubundaki değerlerin küçükten büyüğe sıralandığında tam ortaya düşen değer ortanca değeridir. Kitledeki birimlerin sayısı çok fazla ise verilerin özetlenmesinde merkezi eğilim ölçüsü olarak ortanca kullanılabilir. Ortanca, sınıflama ölçme düzeyi ile ölçülen değişkenler için kullanılmaz. Eşit aralıklı, oran ve sıralama ölçme düzeyinde ölçülen değişkenler için kullanılır.

11 Örnek: Aynı hastalığa sahip 12 kişilik bir gruba yapılan ilaç tedavisi sonucu iyileşme süreleri gün olarak aşağıdaki gibi verilmiştir.

12 Ortancanın özellikleri,
Aşırı uç değerlerden etkilenmez. Birim değerleri ile ortanca arasındaki farkın yarısı negatif yarısı pozitiftir. ∑ |Xi – ortanca|= minimum’dur.

13 2.1.4. Aritmetik Ortalama, Tepe Değer ve Ortanca Arasındaki İlişki
Aritmetik ortalama, ortanca ve tepe değer arasındaki ilişki verilerin dağılımının çarpıklığı hakkında bilgi verir.

14 Çeyreklikler Küçükten büyüğe doğru sıralanmış verileri dört eşit parçaya bölen değerlere çeyrek değerler denir. Birinci çeyreklik (Q1), veriler küçükten büyüğe sıralandığında verilerin %25 ini sağında, %75 ini solunda bırakan değerdir. İkinci çeyreklik ortancaya denk gelmektedir. Üçüncü çeyrek değer (Q3), veriler küçükten büyüğe sıralandığında verilerin %75 ini sağında, 22 %25 ini solunda bırakan değerdir. Yani sıralı verilerde, ortancadan küçük olan değerlerin ortancası birinci çeyrek değer, ortancadan büyük olan verilerin ortancası üçüncü çeyrek değerdir.

15

16 Geometrik Ortalama

17 Geometrik ortalamanın özellikleri,
Herhangi bir veri sıfır veya negatif değerli ise geometrik ortalama hesaplanamaz. Uç değerlerden aritmetik ortalama kadar etkilenmez. Aritmetik ortalamadan küçüktür. Gözlem sonuçlarının geometrik ortalamaya oranlarının çarpımları 1 dir.

18

19 2.2. Dağılım Ölçüleri Değişim Genişliği

20 Çeyrek Sapma

21 2.2.3. Varyans ve Standart Sapma
Varyans, birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile elde edilir. Varyans gözlem sonuçlarının aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya koyan bir dağılım ölçüsüdür. Kitle varyansı , örneklem varyansı ile gösterilir. Standart sapma varyansın kareköküdür. Kitle standart sapması , örneklem standart sapması s ile gösterilir.

22 Standart Hata

23 Değişim Katsayısı

24 Çarpıklık (Skewness) Bir dağılımın normal dağılıma göre simetrik ya da çarpık olup olmadığını belirten bir ölçüdür. a3 ile gösterilir. Simetrik (normal) dağılımda a3 değeri 0 (sıfır)’dır. Gözlemsel dağılım simetrik ise çarpıklık ölçüşünün sıfıra eşit ya da çok yakın olması gerekir. Pozitif çarpıklık küçük değerlerin fazlalıkta olduğunu, negatif çarpıklık ise büyük değerlerin fazlalıkta olduğunu gösterir. Herhangi bir veri setinde ortalamanın medyandan büyük olması durumunda sağa çarpık dağılım, ortalamanın medyandan küçük olması durumunda sola çarpık dağılım ortaya çıkar.

25 Basıklık (Kurtosis) Basıklık dağılımın “dikliğini” veya “düzgünlüğünün” yani verilerin tepe noktalarının durumu hakkında bilgi veren ölçüttür. Sıfıra yakın bir basıklık normal dağılıma yakın bir şekli oluşturur. Basıklık için pozitif bir değer ise normalden daha dik bir dağılıma işarettir. Negatif bir basıklık değeri ise normalden daha düz bir dağılıma işarettir.

26 SPSS Analyse Menüsü İstatistiksel analiz yöntemlerini uygulamak için kullanılan bir menüdür.

27 1- Reports: Analyze menüsünün bir alt menüsü olan Reports ile veri setinde yer alan satır (Report Summaries in Rows), sütun (Report Summaries in Columns) ya da tümüne (Case Summaries) ilişkin kısa rapor içeriğinde tanımlayıcı istatistikler hesaplanır.

28 OLAP Cubes: Seçilen değişkenlerin istatistiksel işlemlerini yapar.
Case summaries: Verilerin frekans ve çapraz tablolarının oluşturulması, belirtici istatistiklerin hesaplanması, grafik çizimi ve raporlanmasını sağlar. Report Summaries in Row: Sıralara ilişkin özet istatistikler hesaplar. Report Summaries in Column: Değişkenlerle ilgili özet istatistikler hesaplar.

29 2- Descriptive Statistics:
Analyze menüsünün bir alt menüsü olan Descriptive Statistics ile veri setine ilişkin frekans tablosu, tanımlayıcı istatistikler, grafikler ve çapraz tablolar (Frequencies, Descriptive Statistics, Explore, Crosstabs) oluşturulur.

30 Frequencies: Verilerin frekans tablosunu, belirtici istatistikleri, dağılım ölçülerini hesaplar ve grafiklerini çizer. Descriptives: Verilerin belirtici istatistiklerini ve asimetrik dağılım ölçüleri olan çarpıklık (kurtosis), basıklık (skewnes) ölçülerini hesaplar. Explore: Tüm birimlerin yada her bir gruptaki birimlerin belirtici istatistiklerini hesaplar ve yayılım grafiklerini çizer. Bir değişkenin diğer değişkene göre istatistiklerini bulur. Crosstabs: İki yada daha fazla değişkenin ikili çapraz tablolarını düzenler. Hazırlanan tablolara testler yapılır ve özet istatistikler bulunur. Sayısal değişkenler kodlama ile az sayıdaki gruba bölünerek çapraz tablolar düzenlenir.  

31 TRANSFORM MENÜSÜ Veri dosyasındaki değişkenlerden yeni değişkenler türetmek, dönüşüm işlemlerini gerçekleştirmek için kullanılan bir menüdür.  

32 1) Compute Compute alt menüsünde, nümerik ve string değişkenler için hesaplamalar yapılarak tüm birimler için yeni değişkenler oluturulabilir ya da varolan bir değişkenin değerleri değiştirilebilir. Mantıksal koşullar altında verinin alt grupları için hesaplamalar yapılabilir. Aritmetik fonksiyonlar, istatistiksel fonksiyonlar, dağılım fonksiyonları ve string fonksiyonları ile 70’in üzerinde farklı fonksiyon oluşturulabilir. 2) Count Her bir birim için iki ya da daha fazla değişkende aynı değer veya değerlere sahip gözlemlerin sayılmasını sağlar.

33 3) Recode Recode alt menüsündeki Into Same Variables alt menüsü, bir değişkenin belirlenen aralıktaki değerlerinin yeni kod değerlerine dönüştürülmesini ve bu kod değerlerinin aynı değişken üzerine yazdırılmasını sağlar. Into Different Variables alt menüsü, bir değişkenin belirlenen aralıktaki değerlerinin yeni kod değerlerine dönüştürülmesini ve bu kod değerlerinin farklı bir değişken olarak yazdırılmasını sağlar.

34 Uygulama : YTÜ İstatistik bölümü öğrencilerinden SPSS dersini alan 20 öğrencinin vize ve final notları aşağıdaki gibidir. Merkezi eğilim ve dağılım ölçülerini hesaplayınız. Vize 90,00 21,00 60,00 22,00 20,00 80,00 100,00 30,00 15,00 70,00 45,00 50,00 24,00 65,00 Final 20,00 27,00 75,00 60,00 80,00 40,00 50,00 70,00 90,00 77,00 10,00 45,00 25,00 85,00

35 1) Merkezi Eğilim Ölçülerinin Bulunması

36

37 20 öğrencinin aldığı final notlarının ortalaması 48’dir.

38 Mean > Median > Mod
20 öğrencinin final notuna ilişkin ortanca değer 47’dir. Tepe değeri 20’dir. Bunun anlamı 20’ye yakın not alan öğrencilerin sayısının fazla olmasıdır. Mean > Median > Mod Yönlü Eğimli

39 Geometrik Ortalamanın bulunması:

40 Geometrik Ortalamanın bulunması:

41 Yapılan işlemler sonucu aşağıdaki çıktıya ulaşılır.
Geometrik Ortalama (40,87) < Aritmetik Ortalama (48,45)

42 2) Dağılım Ölçülerinin Bulunması

43 Dağılım Genişliği ve Maximum, Minimum Değerlerinin çıktıları aşağıdaki gibidir.
Değişim Genişliği = Max – Min Final sınavından alınan en yüksek not 90 en düşük not ise 10’dur.

44 Standart Sapma, Varyans ve Standart Hata bulunması.

45 Standart Hata, Standart Sapma ve Varyans Değerlerinin çıktıları aşağıdaki gibidir.
Standart sapma 26,142 bulunmuştur. Buradan 20 öğrencinin finalden aldıkları notlar arasındaki farklılığın fazla olduğunu söyleyebiliriz.

46 Basıklık ve Çarpıklığın Ölçülmesi
Analyze  Descriptives Statistics  Frequencies Skewness (Çarpıklık Katsayısı) Kurtosis (Basıklık Katsayısı)

47 Basıklık Katsayısı : - 1,540 Çarpıklık Katsayısı : 0,161
Dağılım standart normal dağılıma uygun değildir. Uygun olması için her iki katsayının 0’a eşit olması gerekirdi. Basıklık katsayısı 0’dan küçük (negatif değerli) ise dağılım basıktır. Çarpıklık katsayısı 0’dan büyük (pozitif değerli) ise dağılım + yöne eğimli ve sağa çarpıktır.

48 SORU : 92 kişiden ölçülen sistolik kan basınçları aşağıda verilmiştir
SORU : 92 kişiden ölçülen sistolik kan basınçları aşağıda verilmiştir. Bu verileri bilgisayara girerek istenilenleri bulunuz. a) Aritmetik ortalama (mean), ortanca değer (median), en küçük değer (min), en büyük değer (max), değişim aralığı (range), standart sapma (standard deviation), standart hata (standart error of mean) değerlerini bulunuz. b) Çarpıklık katsayısı (skewness)’ nı bularak çarpıklığın şeklini belirleyiniz. c) Basıklık katsayısı (kurtosis)’nı bularak eğrinin basık mı yoksa sivri mi olduğunu belirleyiniz.

49 1-) Ortalama , ortanca ve tepe değeri hakkında kısaca bilgi veriniz ve SPSS ‘de bunların bulunmasını sağlayan adımları yazınız . Cevap : Ortalama , Birimlerin belirli bir değişken bakımından aldıkları değerlerin toplamının birim sayısına bölümü olarak tanımlanır. Ortanca , Bir veri gurubundaki değerlerin küçükten büyüğe sıralandığında tam ortaya düşen değer ortanca değeridir. Tepe Değeri , Bir veri grubunda en çok tekrarlanan değere tepe değer(mod) denir. SPSS’de veriler girildikten sonra sırasıyla şunlar yapılır : Analyze sekmesinden descriptive statistics , oradan da frequencies tıklanır . Çıkan ekranda mean,median ve mode seçilerek continue kutusuna tıklanır . 2-) Std. Hata , Std. Sapma ve Varyans konusunda kısaca bilgi verip SPSS ‘de yapılması gereken adımları söyleyiniz . Cevap : Varyans, birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile elde edilir. Standart sapma varyansın kareköküdür Standart hata, örneklem aritmetik ortalamasının hatasını ifade eder. SPSS de Analyze sekmesinden descriptive statistics , oradan da frequencies tıklanır . Çıkan ekranda varianca , std. error ve std. deviation kutucukları işaretlendikten sonra continue ‘ya basılır . 3-)Analyse menüsü ve descriptive statistics sekmesini kısaca anlatınız . Cevap : Analyse menüsü istatistiksel analiz yöntemlerini uygulamak için kullanılan bir menüdür . Desciriptive statistics ise verilerin frekans tablosunu, belirtici istatistikleri, dağılım ölçülerini hesaplayıp grafiklerini çizmemizi ve çapraz tablo oluşturmamızı sağlar .


"TEMEL BETİMLEYİCİ İSTATİSTİKLER" indir ppt

Benzer bir sunumlar


Google Reklamları