Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri

Slides:



Advertisements
Benzer bir sunumlar
MERKEZİ YIĞILMA (EĞİLİM) ÖLÇÜLERİ
Advertisements

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
İSTATİSTİK VE OLASILIK I
Tanımlayıcı İstatistikler
Standart Normal Dağılım
Tanımlayıcı İstatistikler
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
ÖLÇME VE DEĞERLENDİRME DERSİ
Merkezi Eğilim (Yığılma) Ölçüleri
İstatistikte Bazı Temel Kavramlar
Değişkenlik Ölçüleri.
Frekans Dağılımı ve Grafikleme
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
VERİLERİN DERLENMESİ VE SUNUMU
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
TANIMLAYICI İSTATİSTİKLER
Merkezi Eğilim (Yer) Ölçüleri
VERİ İŞLEME VERİ İŞLEME-4.
Tuğçe ÖZTOP İlköğretim Matematik Öğretmenliği 2. sınıf
Betimleyici İstatistik – I
Merkezi Eğilim (Yer) Ölçüleri
Bu slayt, tarafından hazırlanmıştır.
Ölçme Sonuçlarının Değerlendirilmesi
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
DEĞİŞKENLİK ÖLÇÜLERİ.
VERİLERİN TOPLANMASI, DÜZENLENMESİ VE TABLO VE GRAFİKLER YARDIMIYLA SUNUMU İstatistik Doç. Dr. Şakir GÖRMÜŞ SAÜ.
Asimetri ve Basıklık Ölçüleri
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri
Merkezi Eğilim Ölçüleri (Ortalamalar)
Sıklık Tabloları ve Tek Değişkenli Grafikler
Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK
İki Değişkenli Tablo ve Grafikler
İSTATİKSEL MERKEZİ EĞİLİM ÖLÇÜLERİ (ORTALAMALAR)
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Sayısal Tanımlayıcı Teknikler
GRAFİK NEDİR?   İstatistik bilim dalında çeşitli yöntemlerle elde edilen sonuçların çizgi ve şekillerle ifade edilmesine grafik denir.
Merkezi Eğilim Ölçüleri (Ortalamalar)
Uygulama 3.
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri
Merkezi Eğilim Ölçüleri (Ortalamalar)
Asimetri ve Basıklık Ölçüleri
Analitik olmayan ortalamalar
Bölüm 03 Sayısal Tanımlama Teknikleri
Sayısal Analiz Sayısal İntegral 3. Hafta
Merkezi Eğilim Ölçüleri (Ortalamalar)
Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
Rastgele Değişkenlerin Dağılımları
ÖLÇME VE DEĞERLENDİRME DERSİ
ARAŞTIRMA YÖNTEM ve TEKNİKLERİ
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Merkezi Eğilim Ölçüleri
VERİLERİN DERLENMESİ VE SUNUMU
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri
İŞLU İstatistik -Ders 3-.
DEĞİŞKENLİK ÖLÇÜLERİ.
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
DEĞİŞKENLİK ÖLÇÜLERİ.
Sapma (Dağılma) ölçüleri
Tıp Fakültesi UYGULAMA 2
ÖLÇME-DEĞERLENDİRME 8. SINIF
ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
İstatistik Ders Notları.
Sunum transkripti:

Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri Verilerin İşlenmesi Yapılan bir araştırmada elde edilen veriler dağınık, düzensiz ve karmaşık bir hal içerir. Bu şekliyle veriden anlamlı bir sonuca ulaşmak mümkün değildir. İstatistik analizin hammaddesi niteliğinde olan bu ham verinin işlenerek düzenli ve anlaşılır hale getirilmesi gerekir. Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden faydalanılır.

Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri

Veri Düzenleme Zaman Serileri Bir değişkenin değerlerinin zamanın şıklarına göre (gün, ay, mevsim, yıl vb.) değişimini gösteren serilere zaman serisi denir. Zaman serisi verileri eşit zaman aralıkları ile derlenmiş verilerden oluşur. Yıllar X malı fiyatı 2000 12 2001 18 2002 15 2003 20 2004 27 2005 24

Veri Düzenleme Kalitatif (niteliksel) Veriler ve Dağılışları Kalitatif (Niteliksel) verileri basit tasnif ya da bileşik tasnif işlemine tabi tutabiliriz. Basit tasnif işlemi sadece bir değişkenin şıklarına göre yapılan tasniftir. Yanda öğrencilerin mezun oldukları lise değişkeninin şıklarına göre dağılışı basit tasnif işlemine örnek gösterilebilir. MYO öğrencilerinin mezun olduğu Lise türüne göre dağılımı Lise türü Frekansı Yüzdesi Kümülatif yüzde Düz lise 143 43,7 End Meslek 123 37,6 81,3 Ticaret 23 7,1 88,4 Anadolu Fen 5 1,5 88,9 Diğer 33 10,1 100 Toplam 327

Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi Aşağıdaki tabloda öğrencinin mezun olduğu lise değişkeni ile cinsiyet değişkeninin birlikte değişimi bileşik tasnif işlemi ile gösterilmiştir. MYO öğrencilerinin mezun olduğu Lise ve cinsiyet değişkeninin şıklarına göre dağılışı Lise türü Erkek Kız Toplam Yüzde Düz lise 88 55 143 43,7 End Meslek 95 28 123 81,3 Ticaret 10 13 23 88,4 Anadolu Fen 2 3 5 89,9 Diğer 19 14 33 100,0 214 113 327

Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi Niceliksel olarak ifade edilen sayısal olarak ifade edilen ya da ölçülebilir özellik taşıyan değişkenlere ait verilerin istatistik bölünme serileri ile gösterilmesinde basit, tasnif edilmiş ve gruplanmış seriler kullanılır. Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. Tasnif edilmiş seri: Tasnif edilmiş serilerde tekrarlayan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir.

Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi Basit seri örnekleri Notlar Uzunluklar Satışlar 10 143 3 22 147 4 30 155 6 43 160 7 50 167 55 170 63 176 8 70 185 90 191 9

Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi Tasnif edilmiş seri örnekleri Notlar (Xi) Öğr.say (fi) Uzunluk Fert say Satışlar Gün say 1 3 160 4 2 5 165 8 170 6 180 7 190 Toplam 21 15 16

Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi Gruplanmış seri örnekleri Notlar Öğrenci sayısı Uzunluk Fert Satışlar Gün 0 - 20 4 140 – 150 2 10 – 30 1 20 – 40 10 150 – 160 5 30 – 40 40 – 60 20 160 – 170 12 40 – 50 7 60 – 80 13 170 – 180 50 – 70 6 80 –100 3 180 – 190 70 – 100

Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur. Yandaki seride KOBİ’lerde çalışan işçi sayısı değişkeni kesikli bir özelliğe sahiptir. Bu değişken tamsayı dışında değerler almaz. Bu sebeple sınıflar arası boşluklar oluşur. Çalışan İşçi Sayısı KOBİ Sayısı 5 – 14 10 15 – 24 20 25 – 34 25 35 – 44 15 45 – 54 5

Basit ve tasnif edilmiş serinin Gruplanmış seriye dönüştürülmesi Basit ve tasnif edilmiş serilerle verinin anlaşılır hale gelmesi mümkün olmuyorsa böyle durumlarda veriyi sınıflara ayırarak gruplanmış seriye dönüştürmek gerekebilir. Veriyi gruplamak için aşağıdaki Sturges sınıf aralığı formülü kullanılabilir. S: Sınıf aralığı Xmax: Verinin en büyük değeri Xmin: Verinin en küçük değeri N: Veri sayısı

Bir verinin gruplanmış seriye dönüştürülmesi Xmin: 25 Xmax: 95 Serinin sınıf aralıkları 11 birim olacak şekilde gruplanması uygun olacaktır. Öğrencilerin ağırlıkları 37 67 79 58 51 33 53 95 60 64 43 66 81 65 50 70 46 59 57 77 25 40 56 89 63 80 73

Bir verinin gruplanmış seriye dönüştürülmesi Ağırlıklar Öğrenci sayısı 25 - 36 dan az 2 36 - 47 “ “ 4 47 - 58 “ “ 9 58 - 69 “ “ 12 69 - 80 “ “ 5 80 - 91 “ “ 3 91 - 100 “ “ 1

Çapraz Tablolar Bazı durumlarda değişkenin iki farklı özelliğinin aynı tabloda eşleştirilmiş olarak gösterilmesi istenebilir. Böyle durumlarda çapraz tablo kullanılır. Tabloda satıra istatistik birimlerin bir özelliği, sütuna diğer özelliği yazılarak ortak eleman sayıları hücrelere yazılmak suretiyle çapraz tablolar oluşturulur. Çapraz tablolar hem niteliksel, hem de niceliksel veriler için oluşturulabilir. Aşağıda MYO öğrencilerinin mezun oldukları lise türü ve öğrenim gördükleri bölümlere göre dağılışı verilmiştir. Bu tablo niteliksel veriler için düzenlenmiş bir tablodur.

Çapraz Tablo Örneği Lise Lise Türü Bölümler Çevre Bilgisayar Kalıpçılık Lojistik Makine Mekatronik Düz lise 27 11 16 8 17 9 Anadolu Fen 2 1 Ticaret 3 5 End. Meslek Diğer 6 Toplam 32 23 29

Verilerin Grafiklerle Gösterilmesi Niteliksel seriler ve Tasnif edilmiş seriler için çubuk diyagramı Notlar Öğrenci sayısı 1 3 2 7 10 4 6 5

Gruplanmış serinin Histogram grafiği Bu grafiğin diğer bir ismi sütun grafiğidir. Grafiğin özelliği sürekli karakterde verilerin grafiği olması sebebiyle histogram sütunların birbirine bitişik olmasıdır

Gruplanmış serinin Histogram grafiği Sınıf aralıkları eşit olmadığı durumda da histogram grafiği yine önceki örnekte olduğu gibi çizilir, yani histogram sütunlarının alanını frekansa eşit yapacak şekilde frekansların yeniden hesaplanması gerekir. Yanda öğrenci notları serisi farklı sınıf aralıkları ile verilmiştir Notlar Öğrenci sayısı 0 – 5 den az 10 5 – 7 den az 20 7 – 9 dan az 14 9 - 10 5

Gruplanmış serinin Histogram grafiği Notlar Öğrenci sayısı Sınıf Genişliği Ayarlanmış frekans 0 – 5 10 5 10/5 = 2 5 – 7 20 2 20/2 = 10 7 – 9 14 14/2 = 7 9 - 10 1 5/1 = 5 Eğer seri açık sınıflı ise histogramı çizilemez. Birinci sınıfın alt limiti veya son sınıfın üst limiti veya ortadaki gruplardan birisi yoksa bu seri açık sınıflı seri olur (20-25 sınıfında 20 veya 25 den birisi yoksa)

Frekans Eğrisi (Poligonu) Histogram sütunlarının üst orta noktalarından geçen grafiktir. Bu grafik dağılımın şeklini ortaya koymada kullanılan bir grafiktir. Not sınıfları Öğrenci sayısı 25 – 36 den az 2 36 – 47 “ “ 4 47 – 58 “ “ 9 58 – 69 “ “ 12 69 – 80 “ “ 5 80 – 91 “ “ 3 91 – 100 “ “ 1

Dairesel Grafikler Özellikle niteliksel (sayısal olmayan) değişken değerlerinin grafikle gösterilmesinde kullanılırlar. Dairenin frekanslara açısal olarak paylaştırılması ile elde edilir. Bir birimin açısal karşılığı şöyle bulunur. Açısal değer Her kategorinin frekansı bu 3 ile çarpılarak dairedeki açısal değeri bulunur.

Dairesel Grafikler Mezun old. Lise Öğr. sayısı Açısal değer End. Meslek Lis. 50 150 Düz Lise 40 120 Ticaret Lisesi 20 60 Diğer Liseler 10 30 Toplam 360

Zaman Serisi Grafiği (Çizgi Grafiği) Zamana bağlı olarak sabit aralıklarla toplanmış olan verilerin eğilimini ve değişimini izleyebilmek için çizgi grafiklerinden faydalanılır. Grafikte yatay eksen zamanı, dikey eksen ise zaman serisi değerlerini göstermektedir. Zaman serileri artan, azalan, durağan ya da periyodik değişen veya bu özelliklerin bir kısmını içeren verilerden oluşur. Nüfus, gelir, enerji tüketimi, konut sayısı vs. artan zaman serilerine örnek gösterilebilir. Modası geçen, teknolojisi eskiyen ürünlerin satışı azalan zaman serisi niteliğindedir. Konutlarda tüketilen doğalgaz miktarı, meşrubat tüketimi vb. hem eğilimli hem de periyodik değişim gösteren bir özelliğe sahiptir.

Artan bir zaman serisi ve grafiği Yıllar X malı fiyatı 2000 12 2001 18 2002 15 2003 20 2004 27 2005 24

Dağılım Grafiği Aralarında ilişki olduğu düşünülen iki değişkenin birbirine göre nasıl bir değişim gösterdiğini, nasıl bir ilişki içinde olduğunu gösteren grafiklerdir. Genellikle bu değişkenlerden bir etkileyen (bağımsız, açıklayan), diğeri etkilenen (bağımlı, açıklanan) değişken olarak ortaya çıkar. Bir malın fiyatı ile onun talebi arasında ters bir ilişki olduğu düşünülür. Kişilerin gelirleri ile tüketim harcamaları arasında pozitif bir ilişkinin olduğu kabul edilir. Aşağıda öğrencilerin matematik notları ile istatistik notları arasındaki ilişki dağılım grafiği ile gösterilmiştir.

Dağılım Grafiği İstatistik notu Matematik notu 60 70 30 25 50 40 55 80 90 20 15

Üç boyutlu grafikler Çapraz tablo şeklindeki verilerin grafikle gösteriminde kullanılır. Bu grafikte dikey eksen frekansları, yatay eksenler ise değişkenin iki özelliğini gösterecek şekilde dizayn edilir. Lise Çevre Bilgisa yar Kalıp çılık Lojis tik Düz lise 17 11 6 8 Ticaret 2 Anadolu 3 5 13 EML 9 15 Diğer

Merkezi Eğilim Ölçüleri (Ortalamalar) Analitik Ortalamalar Aritmetik Geometrik Harmonik Kareli ortalama Analitik olmayan ortalamalar Mod Medyan Kartil, Desil ve Santiller

I. Merkezi Eğilim Ölçüleri (Ortalamalar) Bir veri setinin merkez noktasını gösteren, serinin normal değerinin bir göstergesi olan ve veriyi tek bir değerle ifade eden değerlere merkezi eğilim ölçüleri adı verilir. Bir verinin ortalaması onun en küçük ve en büyük değeri arasında yer alır. Ortalamaların Faydaları: Ortalamaların faydaları kısaca şöyle özetlenebilir. Ortalamalar çoğu zaman serinin normal değerini gösterir. Tabi bunun için serinin dağılımının da aşırı çarpık olmaması gerekir. İstatistik analiz işleminin temel elemanlarından biridir. Aynı birimle ölçmek kaydıyla farklı serileri karşılaştırmaya imkan tanır. Tek bir sayı olması sebebiyle hatırda tutulması kolaydır.

Ortalamalar verinin tamamını kapsayıp kapsamamasına göre analitik ve analitik olmayan ortalamalar şeklinde iki grupta incelenir. Analitik (Hassas ortalamalar) Verideki bütün değerleri dikkate alarak hesaplanan ortalamalardır. Analitik ortalamalar verinin özelliğine ve hesap tarzına göre dört farklı şekilde elde edilir. 1.1. Aritmetik ortalama 1.2. Geometrik ortalama (G) 1.3. Harmonik ortalama (H) 1.4. Kareli ortalama (K).

1.1. Aritmetik ortalama Aritmetik ortalama serideki gözlem değerleri toplamının toplam gözlem sayısına oranıdır. Basit seride Tasnif edilmiş seride Gruplanmış seride Xi : i. gözlem değeri fi : i. değerin frekansı mi : i. sınıfın orta noktası N : toplam gözlem sayısı

Nisan ayı yağışları (Kg) (Xi) Örnek: Adapazarı'nda nisan ayı ortalama yağışlarını tahmin etmek için geçmiş nisan ayı yağış rakamlarından rasgele 7 tanesi seçilmiş ve aşağıdaki sonuçlar elde edilmiştir. Bu verilerden hareketle Adapazarı'nda nisan ayı yağışlarının aritmetik ortalamasını hesaplayınız. Nisan ayı yağışları (Kg) (Xi) 60 75 80 100 120 130 155 ∑Xi=720

Örnek Bir işletmede aynı parçayı üreten işçilerin bu parçayı üretim sürelerinin dağılımı aşağıdaki gibi gözlenmiştir. Parça üretim süresinin aritmetik ortalamasını bulunuz. Parça üretim süresi(dk)(Xi) İşçi sayısı (fi) fi.Xi 12 2 24 13 5 65 14 10 140 15 7 105 16 4 64 Toplam 28 398

Örnek Bir işyerinde yapılan telefon görüşmelerinin süresinin dağılımı için aşağıdaki gruplanmış seri verilmiştir. Buna göre görüşme süresinin aritmetik ortalamasını bulunuz. Görüşme süresi Görüşme sayısı (fi) mi fimi 0 - 2 5 1 2 - 4 10 3 30 4 - 6 40 200 6 - 8 7 210 8 - 10 25 9 225 Toplam 110 670

Tartılı Aritmetik Ortalama Bir serideki gözlem değerlerlerinin önem dereceleri farklı olursa, bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için önem derecesini gösteren katsayılar (tartılar) kullanılır. Örnek olarak öğrencilerin ortalama notlarını hesaplarken derslerin kredileri tartı olarak düşünülürken, ücretlerin belirlenmesinde kıdem tartı olarak kabul edilebilir. Basit seride Tasnif edilmiş seride Gruplanmış seride

Örnek Aşağıda bir öğrencinin almış olduğu dersler, notları ve kredileri verilmiştir. Not ortalamasını tartılı aritmetik ortalama cinsinden hesaplayınız. Dersler Notlar (Xi) Kredi (ti) tiXi İstatistik 70 3 210 Matematik 60 4 240 Fizik 50 150 Kimya 80 2 160 Toplam 260 ti=12 tiXi=760

Örnek Bir işletmede işçilerin saat ücretleri çalıştıkları süre (kıdem) dikkate alınarak belirlenmektedir. Veriler aşağıdaki gibi olduğuna göre bu işletmede ortalama saat ücretini tartılı aritmetik ortalama cinsinden hesaplayınız. Saat ücreti (TL) İşçi sayısı (fi) Ortalama kıdem (ti) mi fiti fitimi fimi 1.00 – 1.40 10 2.5 1.20 25 30.0 12.00 1.40 – 1.60 30 5.0 1.50 150 225.0 45.00 1.60 – 1.80 50 9.5 1.70 475 807.5 85.00 1.80 – 2.00 15 13.0 1.90 195 370.5 16.90 2.00 – 2.50 5 18.0 2.25 90 202.5 11.25 Toplam 110 935 1635.5 170.15

Tartılı aritmetik ortalamanın kullanıldığı yerler - Veriler arasında önem farkı bulunması halinde kullanılır. - Oranların ve ortalamaların ortalaması hesaplanırken kullanılır. - Ortalama maliyet ve satış fiyatı, bileşik fiyat ve miktar indekslerinin hesaplanmasında da tartılı ortalama kullanılır. Örnek Bir işletmede bulunan üç tezgahın belli bir günde ürettikleri malların sayısı ve üretimlerindeki kusurlu oranları aşağıdaki tabloda verilmiştir. Buna göre bu tezgahların ürettiği mamul kütlesinin kusurlu oranını bulunuz. Tezgahlar Üretim miktarı (ti) Kusurlu oranı (Xi) tiXi A 100 0.03 3 B 200 0.05 10 C 50 0.01 0.5  ti = 350 Xi = 0.09 tiXi = 13.5

Aritmetik ortalamanın özellikleri 1 - Aritmetik ortalama hassas bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı değere doğru kayma gösterir. 2 - Serinin gözlem sayısı ile aritmetik ortalaması çarpılırsa serinin toplam değeri elde edilir. 3- Serideki gözlem değerlerinin aritmetik ortalamadan sapmaları toplamı sıfır olur. 4- Serideki değerlerin aritmetik ortalamadan sapmalarının kareleri toplamı minimum olur. 5- Aritmetik ortalama özellikle normal dağılıma yakın serilerin ortalaması için elverişlidir. 6- Bir serinin değerleri, diğer iki serinin değerleri toplamından oluşuyorsa bu serinin aritmetik ortalaması da diğer iki serinin aritmetik ortalamaları toplamına eşit olur. X =Y +Z