SAYISAL VERİLERİN SINIFLANDIRILMASI

Slides:



Advertisements
Benzer bir sunumlar
Ölçme Düzeyleri Ölçeklerin Kullanılması
Advertisements

Tanımlayıcı İstatistikler
ONDALIK KESİR.
BİLİŞİM TEKNOLOJİLERİ & BİLGİ TOPLUMU
İstatistikte Temel Kavramlar
DERS-7 TESTLER Prof. Dr. Hüseyin BAŞLIGİL YILDIZ TEKNİK ÜNİVERSİTESİ
İstatistikte Bazı Temel Kavramlar
OLASILIK ve OLASILIK DAĞILIMLARI
Excel Nedir? Arkadaşlar Excel Bir hesap tablosu (spreadsheet) programıdır.  Excel, her türlü veriyi (özellikle sayısal verileri) tablolar ya da listeler.
Değişkenlik Ölçüleri.
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
Tek ve İki Değişkenli Grafikler
Ondalık Kesirler ● Paydası 10, 100, 1000… olan kesirlere ondalık kesir denir , , , , ● Yukarıdaki kesirler birer ondalık.
OLASILIK ve KURAMSAL DAĞILIMLAR
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
Merkezi Eğilim (Yer) Ölçüleri
YUVARLAMA TOPLAMA ÇIKARMA
Yıldız Teknik Üniversitesi Makina Müh. Bölümü
Merkezi Eğilim (Yer) Ölçüleri
MATEMATİK 1 POLİNOMLAR.
TOPLAMA İŞLEMİ VE ALIŞTIRMALAR.
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
Bölme İşlemi.
Ondalık Kesirlerde Toplama İşlemi ( on yedi tam yüzde elli sekiz )
İÇERİK(2.HAFTA) Veri Toplama Hedef Kitlenin Belirlenmesi
NEDEN İSTATİSTİK? 1.
Sıklık Tabloları ve Tek Değişkenli Grafikler
İki Değişkenli Tablo ve Grafikler
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Olasılık dağılımları Normal dağılım
Olasılık Dağılımları ve Kuramsal Dağılışlar
Uygulama 3.
KESİKLİ RASSAL DEĞİŞKENLER
Sayısal Analiz Sayısal Türev
VERİ TOPLAMA VE DÜZENLEME
Merkezi Eğilim (Yığılma) Ölçüleri
İSTATİSTİKTE TAHMİN ve HİPOTEZ TESTLERİ İSTATİSTİK
Tanımlayıcı Ölçütler Üzerinde durulan bir çalışmada amaç; elde edilen veri setini bir ya da birkaç ölçü ile özetlemektir. Kullanılan her ölçü dağılımın.
SAYISAL VERİLERİN SINIFLANDIRILMASI
RASYONEL SAYILAR.
Sıklık Tabloları ve Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler.

DERS 4: Sayısal Verileri Anlamlandırma ve Anlatma Akın Şahin.
OLASILIK ve İSTATİSTİK
OLASILIK ve İSTATİSTİK BÖLÜM 2 AÇIKLAYICI (BETİMLEYİCİ) İSTATİSTİK Yrd. Doç. Dr. Fatih TOSUNOĞLU.
Istatistik.
1 Sayısal Data’nın Sunumu. 2 Data Sunumu Özet Tablo Nokta Grafik Pasta Grafik Sayısal Data Sunumu Çubuk Grafik Nitel Data Gövde&Yaprak Gösterim Frekans.
İstatİstİksel verİlerİ Düzenleme- frekans
DERS3 Prof.Dr. Serpil CULA
Yrd.Doç. Dr. Özcan PALAVAN
ÜSLÜ SAYILAR.
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Yrd.Doç. Dr. Özcan PALAVAN
Ondalık Kesirler ● Paydası 10, 100, 1000… olan kesirlere ondalık kesir denir , , , , ● Yukarıdaki kesirler birer ondalık.
ONDALIK KESİR.
Merkezi Eğilim Ölçüleri
MERKEZİ EĞİLİM(YIĞILMA) ÖLÇÜLERİ
ÜNİVERSİTELER İÇİN BİRİMLER DÜZEYİNDE AFP HAZIRLANMASI
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
Uygulama I.
ÜSLÜ SAYILAR Orijinal sunu 70 sayfadır.Örnek Sunu için belli bölümleri kesilmiştir.
KİRİŞ YÜKLERİ HESABI.
Bilgisayar EXCEL II
DAVRANIŞ BİLİMLERİNDE ARAŞTIRMA (YÜKSEK LİSANS)
4. HAFTA.
Sunum transkripti:

SAYISAL VERİLERİN SINIFLANDIRILMASI Sınıf Çetele Frekans % 10-19 //// 4 5 20-29 ////// 6 12

Sayısal Verilerin Sınıflandırılması Sayısal veriler için elde edilecek en kolay sınıflandırma, basit frekans dağılımlarının elde edilmesidir. Bunun için: veriler küçükten büyüğe (ya da büyükten küçüğe) doğru sıralanarak her bir gözlemden kaçar tane olduğu gözlemlerin karşısına yazılır.

Canlı ağırlık Sayı % Toplam 25 100 21,3 21,4 21,8 23,0 24,1 24,2 24,6 26,8 27,3 28,2 30,3 32,0 32,4 3,0 1,0 4,0 2,0 12,0 16,0 8,0 Toplam 25 100

Ancak dağılım aralığı (en büyük değerle en küçük değer arasındaki fark) büyüdükçe basit frekans dağılımları kullanışsızlaşır. Bu durum gözlem sayısının arttığı durumlarda daha da belirginleşir. Bu nedenle veriler sınıflandırılır.

Sınıflandırma işlemlerinin belli adımları vardır Sınıflandırma işlemlerinin belli adımları vardır. Sınıflandırmada kullanılan tanımlar: 1. Sınıf Sayısı: Oluşturulacak sınıf sayısıdır. Örnek: 50-54 55-59 60-64 65-69 70-74 Burada sınıf sayısı 5’tir

2. Sınıf Sınırı: Oluşturulacak her sınıfın bir alt ve bir üst sınırı vardır. Bu sınırlara sınıf sınırları denir. Örneğin 50-54 sınıfının alt sınırı 50 üst sınırı 54’tür. 3. Sınıf Aralığı (c): Ard arda gelen iki sınıfın üst sınırları ya da alt sınırları arasındaki farka sınıf aralığı denir. Yukarıdaki örnek için sınıf değeri= 2. Sınıfın alt sınır değeri ile 1. Sınıfın alt sınır değeri arasındaki fark 55-50=5’tir.

4. Sınıf Değeri: Her sınıfın alt ve üst sınır değerlerinin toplamının yarısıdır. Örneğin herhangi bir sınıfın alt sınırı 50 üst sınırı 54 ise Sınıf Değeri=(50+54)/2=52 5. Dağılım Aralığı: Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur.

Sınıflandırma İşleminde Dikkat Edilecek Noktalar Sınıflandırma sonucunda, dağılımdaki bütün değerler sınıflara dağıtılabilmeli ve hiçbir değer sınıflama dışında kalmamalıdır. Örneğin canlı ağırlık verileri 20-25 26-30 31-35 biçiminde olsaydı sınıflandırma işlemi yanlış olurdu. Çünkü 25-26 ve 30-31 arasında değerler varsa bu gözlemlerin hangi sınıfta yer alacağı belli değildir ve sınıflama yapıldığında bu değerler dışarıda kalır.

Eğer virgülden sonra basamak varsa sınıflama işlemi yapılırken virgülden sonraki haneler dikkate alınmalıdır. Örneğin bu sınıflandırma aşağıdaki gibi yapılabilir. 20,0-24,9 25,0-29,9 30,0-34,9

Sınıflama yaparken sınıflar birbirinin içine girmemelidir Sınıflama yaparken sınıflar birbirinin içine girmemelidir. Örneğin sınıfları   50-54 54-59 59-64 biçiminde oluşturmak hatalıdır. Çünkü 54 ve 59 değerleri iki ayrı sınıfta yer almaktadır. Doğru olanı 50-54 55-59 60-64 olmalıdır.

Sınıf aralıklarının birbirine eşit şekilde düzenlenmesi, istatistiksel çözümlemede kolaylık sağlar. Ancak gerektiğinde sınıf aralıkları eşit olmayabilir. Dağılım hakkında yeterli bilgiye sahip olabilmek için oluşturulacak sınıf sayısının 8-15 arasında olması önerilmektedir. Sınıf sayısının az olması dağılım hakkında ayrıntılı bilgi elde etmemize engel olur.

Örnek : Canlı ağırlık için 25 koyuna ilişkin verileri sınıflandıralım Canlı ağırlık verilerinde En Küçük Değer (EKD)=21.3 En Büyük Değer (EBD)=32.4 ‘tür Dağılım Aralığı (DA) bulunur. Bu örnek için DA = EBD-EKD = 11.1’dir.

Dağılım aralığı değeri belirlediğimiz sınıf sayısına bölünerek sınıf aralığı (C) bulunur. Örneğin veriyi 4 sınıfta toplamak istersek C=11,1/4=2,75 3 olur. (Sonuç tamsayı olacağı için yuvarlama yapılır). Buna Göre sınıflar, dağılımdaki en küçük değerden başlamak üzere aşağıdaki gibi oluşturulur.

EKD EBD 21,3 24,2 24,3 27,2 27,3 30,2 30,3 33,2

Daha sonra her sınıfa düşen frekanslar 1 no’lu hayvandan başlamak üzere çeteleme yapılır ve sayısı yazılır.   Canlı ağırlık Çetele Sayı 21,3 24,2 24,3 27,2 27,3 30,2 30,3 33,2 //////////////// // /// //// 16 2 3 4

Canlı ağırlık Frekans (Sayı) % Yığılımlı 21,3 24,2 24,3 27,2 27,3 30,2 30,3 33,2 16 2 3 4  64.0 8.0 12.0 16.0  18 21 25 64.0 72.0 84.0 100.0 Toplam

Sınıflandırma Örneği sy 9 75 çocuğun boy uzunlukları ölçülmüş, veriler doğrultusunda sınıflandırma örneği 115 94 110 103 92 104 114 106 100 102 113 98 101 99 93 107 96 90 111 105 97 108 109 112 95 91 Max=115 Min=90 DA=115-90=25 25/15<c<25/8 1,7<c<3,1

Çocukların Boy Uzunluğuna İlişkin Frekans Tablosu Sınıflar Çetele Frekans 90-92 /// 3 93-95 ///// 5 96-98 ///// /// 8 99-101 ///// ///// // 12 102-104 ///// ///// //// 14 105-107 ///// ///// / 11 108-110 ///// //// 9 111-113 114-116 Toplam 75