SAYISAL VERİLERİN SINIFLANDIRILMASI

Slides:



Advertisements
Benzer bir sunumlar
PROGRAMDA YAKLAŞIK MALİYETİ İKİ TÜRLÜ HAZIRLAMANIZ MÜMKÜNDÜR.
Advertisements

Yrd.Doç.Dr.Levent Malgaca,2010
İstatistik Tahmin ve Güven aralıkları
Standart Normal Dağılım
Ölçme Düzeyleri Ölçeklerin Kullanılması
Tanımlayıcı İstatistikler
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
BİLİŞİM TEKNOLOJİLERİ & BİLGİ TOPLUMU
İstatistikte Temel Kavramlar
DERS-7 TESTLER Prof. Dr. Hüseyin BAŞLIGİL YILDIZ TEKNİK ÜNİVERSİTESİ
Sürekli Olasılık Dağılımları
İstatistikte Bazı Temel Kavramlar
OLASILIK ve OLASILIK DAĞILIMLARI
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
Kesirler Kesirler kaça ayrılır?.
Tek ve İki Değişkenli Grafikler
Ondalık Kesirler ● Paydası 10, 100, 1000… olan kesirlere ondalık kesir denir , , , , ● Yukarıdaki kesirler birer ondalık.
OLASILIK ve KURAMSAL DAĞILIMLAR
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
Merkezi Eğilim (Yer) Ölçüleri
Yıldız Teknik Üniversitesi Makina Müh. Bölümü
Merkezi Eğilim (Yer) Ölçüleri
MATEMATİK 1 POLİNOMLAR.
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
Bölme İşlemi.
ASAL SAYILAR HAZIRLAYAN EYÜP GÜNER.
Ondalık Kesirlerde Toplama İşlemi ( on yedi tam yüzde elli sekiz )
Örneklem Dağılışları.
İÇERİK(2.HAFTA) Veri Toplama Hedef Kitlenin Belirlenmesi
Sayı Sistemleri Geçen Hafta Kayan Noktalı Sayılar
NEDEN İSTATİSTİK? 1.
Sıklık Tabloları ve Tek Değişkenli Grafikler
İki Değişkenli Tablo ve Grafikler
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Olasılık dağılımları Normal dağılım
Olasılık Dağılımları ve Kuramsal Dağılışlar
Uygulama 3.
Sayısal Analiz Sayısal Türev
Merkezi Eğilim (Yığılma) Ölçüleri
İSTATİSTİKTE TAHMİN ve HİPOTEZ TESTLERİ İSTATİSTİK
- 1 - Bütün formüller “ = “ işareti ile başlamak zorundadır
Tanımlayıcı Ölçütler Üzerinde durulan bir çalışmada amaç; elde edilen veri setini bir ya da birkaç ölçü ile özetlemektir. Kullanılan her ölçü dağılımın.
RASYONEL SAYILAR.
Doğal Sayılarda Toplama Ve Çıkarma İşlemi
Sıklık Tabloları ve Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler.
ARAŞTIRMA YÖNTEMLERİ VE TEKNİKLERİ

DERS 4: Sayısal Verileri Anlamlandırma ve Anlatma Akın Şahin.
Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri.
ANALİZE VERİ HAZIRLAMA SÜRECİ
OLASILIK ve İSTATİSTİK
OLASILIK ve İSTATİSTİK BÖLÜM 2 AÇIKLAYICI (BETİMLEYİCİ) İSTATİSTİK Yrd. Doç. Dr. Fatih TOSUNOĞLU.
Istatistik.
DERS3 Prof.Dr. Serpil CULA
Yrd.Doç. Dr. Özcan PALAVAN
ÜSLÜ SAYILAR.
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Yrd.Doç. Dr. Özcan PALAVAN
Ondalık Kesirler ● Paydası 10, 100, 1000… olan kesirlere ondalık kesir denir , , , , ● Yukarıdaki kesirler birer ondalık.
MERKEZİ EĞİLİM(YIĞILMA) ÖLÇÜLERİ
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
KİRİŞ YÜKLERİ HESABI.
Bilgisayar EXCEL II
DAVRANIŞ BİLİMLERİNDE ARAŞTIRMA (YÜKSEK LİSANS)
SAYISAL VERİLERİN SINIFLANDIRILMASI
Sunum transkripti:

SAYISAL VERİLERİN SINIFLANDIRILMASI Sınıf Çetele Frekans % 10-19 //// 4 5 20-29 ////// 6 12

Sayısal Verilerin Sınıflandırılması Sayısal veriler için elde edilecek en kolay sınıflandırma, basit frekans dağılımlarının elde edilmesidir. Bunun için: veriler küçükten büyüğe (ya da büyükten küçüğe) doğru sıralanarak her bir gözlemden kaçar tane olduğu gözlemlerin karşısına yazılır.

Canlı ağırlık Sayı % Toplam 25 100 21,3 21,4 21,8 23,0 24,1 24,2 24,6 26,8 27,3 28,2 30,3 32,0 32,4 3,0 1,0 4,0 2,0 12,0 16,0 8,0 Toplam 25 100

Ancak dağılım aralığı (en büyük değerle en küçük değer arasındaki fark) büyüdükçe basit frekans dağılımları kullanışsızlaşır. Bu durum gözlem sayısının arttığı durumlarda daha da belirginleşir. Bu nedenle veriler sınıflandırılır.

Sınıflandırma işlemlerinin belli adımları vardır Sınıflandırma işlemlerinin belli adımları vardır. Sınıflandırmada kullanılan tanımlar: 1. Sınıf Sayısı: Oluşturulacak sınıf sayısıdır. Örnek: 50-54 55-59 60-64 65-69 70-74 Burada sınıf sayısı 5’tir

2. Sınıf Sınırı: Oluşturulacak her sınıfın bir alt ve bir üst sınırı vardır. Bu sınırlara sınıf sınırları denir. Örneğin 50-54 sınıfının alt sınırı 50 üst sınırı 54’tür. 3. Sınıf Aralığı (c): Ard arda gelen iki sınıfın üst sınırları ya da alt sınırları arasındaki farka sınıf aralığı denir. Yukarıdaki örnek için sınıf değeri= 2. Sınıfın alt sınır değeri ile 1. Sınıfın alt sınır değeri arasındaki fark 55-50=5’tir.

4. Sınıf Değeri: Her sınıfın alt ve üst sınır değerlerinin toplamının yarısıdır. Örneğin herhangi bir sınıfın alt sınırı 50 üst sınırı 54 ise Sınıf Değeri=(50+54)/2=52 5. Dağılım Aralığı: Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur.

Sınıflandırma İşleminde Dikkat Edilecek Noktalar Sınıflandırma sonucunda, dağılımdaki bütün değerler sınıflara dağıtılabilmeli ve hiçbir değer sınıflama dışında kalmamalıdır. Örneğin canlı ağırlık verileri 20-25 26-30 31-35 biçiminde olsaydı sınıflandırma işlemi yanlış olurdu. Çünkü 25-26 ve 30-31 arasında değerler varsa bu gözlemlerin hangi sınıfta yer alacağı belli değildir ve sınıflama yapıldığında bu değerler dışarıda kalır.

Eğer virgülden sonra basamak varsa sınıflama işlemi yapılırken virgülden sonraki haneler dikkate alınmalıdır. Örneğin bu sınıflandırma aşağıdaki gibi yapılabilir. 20,0-24,9 25,0-29,9 30,0-34,9

Sınıflama yaparken sınıflar birbirinin içine girmemelidir Sınıflama yaparken sınıflar birbirinin içine girmemelidir. Örneğin sınıfları   50-54 54-59 59-64 biçiminde oluşturmak hatalıdır. Çünkü 54 ve 59 değerleri iki ayrı sınıfta yer almaktadır. Doğru olanı 50-54 55-59 60-64 olmalıdır.

Sınıf aralıklarının birbirine eşit şekilde düzenlenmesi, istatistiksel çözümlemede kolaylık sağlar. Ancak gerektiğinde sınıf aralıkları eşit olmayabilir. Dağılım hakkında yeterli bilgiye sahip olabilmek için oluşturulacak sınıf sayısının 8-15 arasında olması önerilmektedir. Sınıf sayısının az olması dağılım hakkında ayrıntılı bilgi elde etmemize engel olur.

Örnek : Canlı ağırlık için 25 koyuna ilişkin verileri sınıflandıralım Canlı ağırlık verilerinde En Küçük Değer (EKD)=21.3 En Büyük Değer (EBD)=32.4 ‘tür Dağılım Aralığı (DA) bulunur. Bu örnek için DA = EBD-EKD = 11.1’dir.

Dağılım aralığı değeri belirlediğimiz sınıf sayısına bölünerek sınıf aralığı (C) bulunur. Örneğin veriyi 4 sınıfta toplamak istersek C=11,1/4=2,75 3 olur. (Sonuç tamsayı olacağı için yuvarlama yapılır). Buna Göre sınıflar, dağılımdaki en küçük değerden başlamak üzere aşağıdaki gibi oluşturulur.

EKD EBD 21,3 24,2 24,3 27,2 27,3 30,2 30,3 33,2

Daha sonra her sınıfa düşen frekanslar 1 no’lu hayvandan başlamak üzere çeteleme yapılır ve sayısı yazılır.   Canlı ağırlık Çetele Sayı 21,3 24,2 24,3 27,2 27,3 30,2 30,3 33,2 //////////////// // /// //// 16 2 3 4

Canlı ağırlık Frekans (Sayı) % Yığılımlı 21,3 24,2 24,3 27,2 27,3 30,2 30,3 33,2 16 2 3 4  64.0 8.0 12.0 16.0  18 21 25 64.0 72.0 84.0 100.0 Toplam

Sınıflandırma Örneği sy 9 75 çocuğun boy uzunlukları ölçülmüş, veriler doğrultusunda sınıflandırma örneği 115 94 110 103 92 104 114 106 100 102 113 98 101 99 93 107 96 90 111 105 97 108 109 112 95 91 Max=115 Min=90 DA=115-90=25 25/15<c<25/8 1,7<c<3,1

Çocukların Boy Uzunluğuna İlişkin Frekans Tablosu Sınıflar Çetele Frekans 90-92 /// 3 93-95 ///// 5 96-98 ///// /// 8 99-101 ///// ///// // 12 102-104 ///// ///// //// 14 105-107 ///// ///// / 11 108-110 ///// //// 9 111-113 114-116 Toplam 75