Tanımlayıcı İstatistikler

Slides:



Advertisements
Benzer bir sunumlar
Çıkarımsal İstatistik
Advertisements

İstatistiğe Giriş  İstatistik ve Biyoistatistiğin Tanımları  Araştırmalarda Biyoistatistiğin Önemi  Temel İstatistik.
EĞİTİMDE ÖLÇME & DEĞERLENDİRME -12-
MERKEZİ YIĞILMA (EĞİLİM) ÖLÇÜLERİ
İstatistik Tahmin ve Güven aralıkları
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
Tanımlayıcı İstatistikler
Tanımlayıcı İstatistikler
Bu slayt ‘ten indirilmiştir.
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
Tıp alanında kullanılan temel istatistiksel kavramlar
ÖLÇME VE DEĞERLENDİRME DERSİ
Normal Dağılım.
STANDART SAPMA ARAŞ.GÖR. MURAT TANDOĞAN
Merkezi Eğilim (Yığılma) Ölçüleri
İstatistikte Bazı Temel Kavramlar
Değişkenlik Ölçüleri.
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
Ölçme sonuçları üzerinde yapılan istatiksel işlemler
OLASILIK ve KURAMSAL DAĞILIMLAR
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
 Merkezi eğilim ölçüleri: Ortalama Ortanca Mod  Ortalama: İki veya ikiden fazla sayının toplamının toplanan sayıların adedine bölünmesiyle elde edilen.
Merkezi Eğilim (Yer) Ölçüleri
Merkezi Eğilim Ölçüleri
Betimleyici İstatistik – I
Merkezi Eğilim (Yer) Ölçüleri
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Varyasyon Katsayısı
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
DEĞİŞKENLİK ÖLÇÜLERİ.
Uygulama I.
Örneklem Dağılışları.
Asimetri ve Basıklık Ölçüleri
Sıklık Tabloları ve Tek Değişkenli Grafikler
Asimetri ve Basıklık Ölçüleri
Sayısal Tanımlayıcı Teknikler
Olasılık Dağılımları ve Kuramsal Dağılışlar
Uygulama 3.
Örneklem Dağılışları ve Standart Hata
Bölüm 03 Sayısal Tanımlama Teknikleri
Merkezi Eğilim (Yığılma) Ölçüleri
Tanımlayıcı Ölçütler Üzerinde durulan bir çalışmada amaç; elde edilen veri setini bir ya da birkaç ölçü ile özetlemektir. Kullanılan her ölçü dağılımın.
Sıklık Tabloları ve Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler.
SU KALİTESİ VERİLERİNİN İSTATİSTİKSEL YÖNTEMLERLE DEĞERLENDİRİLMESİ

Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
Istatistik.
ÖLÇME VE DEĞERLENDİRME DERSİ
MATEMATİK ÖĞRENEBİLİR
Ölçme ve Değerlendirme
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Merkezi Eğilim Ölçüleri
Prof. Dr Hamit ACEMOĞLU Tıp Eğitimi AD
MERKEZİ EĞİLİM(YIĞILMA) ÖLÇÜLERİ
DEĞİŞİM ÖLÇÜLERİ.
Merkeze Yayılma Ölçüleri
DEĞİŞKENLİK ÖLÇÜLERİ.
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
Sapma (Dağılma) ölçüleri
Uygulama I.
Biyoistatistiğe Giriş
Tıp Fakültesi UYGULAMA 2
ÖLÇME-DEĞERLENDİRME 8. SINIF
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
MERKEZİ DAĞILIM ÖLÇÜTLERİ
STANDART SAPMA.
Sunum transkripti:

Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler Yer gösteren ölçüler Merkezi eğilim ölçüleri Konum ölçüleri Yaygınlık ölçüleri Bir dağılımı tanımlayabilmek için çeşitli ölçüler vardır. Bu ölçüler yer gösteren ölçüler ve yaygınlık ölçüleridir.

Merkezi eğilim ölçüleri Yer gösteren ölçüler Konum ölçüleri Çeyreklik Yüzdelik Merkezi eğilim ölçüleri (Ortalama ölçüleri) Aritmetik ortalama Ortanca Tepe Değeri Oran Geometrik ortalama Harmonik ortalama

Yer Gösteren Ölçüler Merkezi eğilim ölçüleri ve konum ölçüleri olmak üzere ikiye ayrılır. Merkezi eğilim ölçüleri bir verinin merkezi diğer bir ifade ile hangi nokta etrafında dağıldığı hakkında bilgi verir. Konum ölçüleri ise bir verideki herhangi bir değerin verinin neresinde yer aldığı hakkında bilgi verir.

Aritmetik Ortalama Veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir. Örnek: 7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun. Buna göre yaş ortalaması:

Aritmetik Ortalama Aritmetik ortalama veri setindeki tüm değerleri dikkate alır. Bu nedenle çok büyük yada çok küçük değerlerden etkilenir. Bu dağılımda 27 yaş aşırı bir değerdir ve aritmetik ortalamanın yüksek çıkmasına neden olur. Tek tepeli, simetrik verilerde kullanılması uygundur.

Ortanca Verileri küçükten büyüğe doğru sıraladıktan sonra tam ortadaki değerdir. Ortanca dağılımın orta noktası hakkında bilgi verir. Aşırı değerlerden etkilenmez sadece veri setinin ortasındaki değeri göz önüne alır. Dağılımda aşırı değerlerin bulunduğu durumlarda veya dağılım simetrik olmadığı durumlarda ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur.

Ortanca Örnek: 7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun. Buna göre yaş ortancası: 5 – 6 – 7 – 8 – 8 – 9 – 27 Ortancadan küçük veri sayısı büyük veri sayısına eşit

Ortanca Örnek: (Veri sayısı çift olsun) 8 kişinin yaşları 6, 8, 7, 8, 5, 9, 15, 27 olsun. Buna göre yaş ortancası: 5 – 6 – 7 – 8 – 8 – 9 – 15 – 27 !!! Bu değer veride yok !!!

Tepe Değeri Tepe değeri bir dağılımda en fazla tekrar eden değerdir. Örnek: 7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun. Buna göre tepe değer: En fazla (iki defa) tekrar eden 8’dir.

Tepe Değeri Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur. En fazla tekrara sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en fazla tekrara sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.

Oran Aritmetik ortalama, ortanca ve tepe değeri sayısal veriler için kullanılan ortalama ölçüleridir. Bu ölçüler yardımıyla kategorik veriler özetlenemez. Kategorik (niteliksel) verileri özetlemek için oran kullanılır. Kategorik verileri karşılaştırmak için de orandan yararlanılır.

Oran Örnek: Bir sınıftaki öğrencilerin cinsiyet dağılımı Sayı Yüzde Kız 45 56.25 Erkek 35 43.75 Toplam 80 100

Çeyreklikler Çeyreklikler 1. Çeyreklik 2. Çeyreklik 3. Çeyreklik Dağılımı 4 eşit parçaya böler Çeyreklikler 1. Çeyreklik Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür. 2. Çeyreklik (Ortanca) Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. 3. Çeyreklik Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür.

Çeyreklikler Örnek: 8 kişinin yaşları 6, 8, 7, 8, 5, 9, 12, 27 olsun. Buna göre yaş ortancası yani dağılımın 2. Çeyreği: Çeyreği: 3. Çeyreği: Ç2=(𝑛+1)×0.50 nci değer, Yani: Ç2=9×0.50=4.5 nci değerdir Ç1=(𝑛+1)×0.25 nci değer, Yani: Ç1=9×0.25=2.25 nci değerdir Ç3=(𝑛+1)×0.75 nci değer, Yani: Ç3=9×0.75=6.75 nci değerdir

Çeyreklikler Örnek: Yaşlar sıralandığında 5, 6, 7, 8, 8, 9, 12, 27 olur. Ç3=9×0.75=6.75 Ç1=9×0.25=2.25 nci değer, Yani: 11.25 nci değer, Yani 6.25 Ç2=9×0.50=4.5 nci değer, Yani: 8

Yüzdelikler Dağılımı 100 eşit parçaya böler. 25. yüzdelik Ç1’e, 50. yüzdelik Ç2’ye (Ortanca) ve 75. yüzdelik Ç3’e eşittir. Yığılımlı sıklığı gösterir. Örneğin verileri küçükten büyüğe doğru sıraladıktan sonra ilk %10’u 10. yüzdeliğe eşit yada ondan küçüktür. 𝑌10=(𝑛+1)×0.10 𝑌20=(𝑛+1)×0.20 𝑌80=(𝑛+1)×0.80

Çeyreklikler Örnek: Yaşlar sıralandığında 20. yüzdelik 5, 6, 7, 8, 8, 9, 12, 27 olur. 𝑌20=9×0.20 = 1.8 nci değer, Yani 5.8

Çeyrekler arası genişlik Yaygınlık Ölçüleri Yaygınlık ölçüleri Dağılım aralığı Standart Sapma Varyans Çeyrekler arası genişlik Çeyrek sapma Değişim Katsayısı Bir dağılımdaki verilerin, merkezine yada birbirine göre ne kadarlık bir değişim gösterdiğini belirtir.

Her iki dağılımında ortalama, ortanca ve tepe değeri aynıdır. Örnek: Her iki dağılımında ortalama, ortanca ve tepe değeri aynıdır. Ancak dağılım 1’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım 2’ye göre daha fazladır. Dağılım 1, dağılım 2’ye göre daha yaygındır. Dağılım 1 7 2 16 3 Dağılım 2 4 8 6 10

Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür. En büyük değerin en küçük değerden çıkarılması ile bulunur. Sadece en uçtaki iki değerle ilgilenir, diğer değerleri dikkate almaz. Bu nedenle aşırı değerlerden etkilenir. Yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür.

Dağılım Aralığı Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda gerçek değişkenlik hakkında bilgi vermez. Biraz önceki örnek için, 1. dağılım 2. dağılıma göre daha yaygındır

Standart Sapma Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. Verideki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalama bir göstergesidir. Standart sapma hesaplanırken verideki tüm değerler dikkate alınır.

Standart Sapma Dağılımın yaygınlığı arttıkça standart sapma büyür. Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır. Standart sapma, tek tepeli ve simetrik dağılımlarda kullanılan bir yaygınlık ölçüsüdür. Veriyi özetlerken ortalama ölçüsü olarak aritmetik ortalama kullanıldığında kullanılır. Çarpık dağılımlarda kullanılması önerilmez.

Örnek: Dağılım 1 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 7 2 -5 25 16 9 81 3 -4 2 -5 25 16 9 81 3 -4 122 Dağılım 2 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 4 -3 9 8 1 7 6 -1 10 3 20

Varyans Aritmetik ortalamaya olan uzaklıkların karesinin ortalamasına varyans denir. Standart sapmanın karesine eşittir. Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamada kullanılmaz.

Örnek: Dağılım 1 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 7 2 -5 25 16 9 81 3 -4 2 -5 25 16 9 81 3 -4 122 Dağılım 2 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 4 -3 9 8 1 7 6 -1 10 3 20

Çeyrekler Arası Genişlik Eğer verinin yapısı çarpıksa ve ortalama ölçüsü olarak ortanca kullanılıyorsa yaygınlık ölçüsü olarak çeyrekler arası genişlik kullanılır. Üçüncü çeyreklikten birinci çeyrekliğin çıkarılması ile bulunur. Dağılımdaki verilerin ortadaki 0.50’ sinin yer aldığı aralığı belirlemek için kullanılır.

Çeyrekler Arası Genişlik Özellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır. Çeyreklikler arası genişlik aşırı uç değerlerden etkilenmez. Çünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir. Eğer incelenen dağılım simetrikse 25. ve 75. yüzdelikler ortancadan eşit uzaklıktadır.

Çeyrek Sapma Bu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür. Çeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. Özellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.

Değişim Katsayısı Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir ve aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. Ancak sadece standart sapmaya bakarak bir dağılımın yaygınlığı konusunda karar vermek her zaman doğru olmayacaktır.

Değişim Katsayısı İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. Değişim katsayısı yüzde cinsinden ifade edilir ve 0 ile 100 arasında değişir. Değişim Katsayısının sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir.

Örnek: Dağılım 1’deki değerler ortalamaya göre %70,6’lık bir değişim gösterirken, dağılım 2’deki değerler %28,57’lik bir değişim göstermektedir. Dağılım 1 Dağılım 2 𝐷𝐾= 4,94 7 𝑥100=70.57 𝐷𝐾= 2 7 𝑥100=28.57

Örnek: Her iki dağılımın standart sapması farklı iken değişim katsayıları aynıdır. Boy Uzunlukları (cm) Boy Uzunlukları (m) 160 1.60 180 1.80 165 1.65 174 1.74 190 1.90 182 1.82 155 1.55 Ortalama 171,38 1,7138 SS 12,07 0,1207 𝐷𝐾= 12,07 171,38 𝑥100=0,07 𝐷𝐾= 0,1207 1,7138 𝑥100=0,07