OLASILIK ve İSTATİSTİK BÖLÜM 2 AÇIKLAYICI (BETİMLEYİCİ) İSTATİSTİK Yrd. Doç. Dr. Fatih TOSUNOĞLU
1-Açıklayıcı (Betimleyici) İstatistik İnceleme sonucu elde edilen ham verilerin istatistiksel yöntemler kullanılarak özetlenmesi açıklayıcı istatistiği konusudur. Açıklayıcı istatistikte kullanılan yöntemler: Frekans Tabloları Şekiller ve Grafikler Histogram ve Frekans Poliganları Sütun ve Pasta Grafikleri
1-Açıklayıcı İstatistik Frekans Tabloları Kullanılan en yaygın yöntemlerden biridir. Örnek frekans tablosu
1-Açıklayıcı İstatistik Frekans Tabloları Verileri frekans tabloları yardımıyla sınıflandırmanın yararları şöyle özetlenebilir: İlgili değişkenin dağılımı hakkında bilgi alınabilir. Verilerin hangi değerler etrafında gruplandığı görülebilir. Ortalama, standart sapma ve varyans gibi değerler daha kolay hesaplanabilir. Bu yararlarına karşın verilerin sınıflandırılması sırasında (özellikle sınıf aralıklarının geniş tutulması halinde) bilgi ve hassasiyet kaybı olmaktadır. Çünkü, herhangi bir sınıfın aralığı içine düşen farklı değerler sadece o aralığın orta değeri ile temsil edilirler.
1-Açıklayıcı İstatistik Frekans Tabloları Frekans tablolarının düzenlenmesinde aşağıdaki sıra izlenir: 1. Sınıf sayısı belirlenir (5 ila 20 arasında olur). Sturgess kuralı SS=1+3.2*log(n) 2. Verilerin değişim genişliği bulunur (DG=enbüyük değer - enküçük değer) 3. Yaklaşık sınıf aralığı bulunur (SA=DG/sınıf sayısı) 4. Birinci sınıfın alt limiti veri grubundaki en küçük değeri içine alacak şekilde belirlendikten sonra, hesaplanan sınıf aralığı bu değere eklenmek suretiyle diğer sınıfların alt limitleri oluşturulur. Bir sınıfın üst limitini bulmak için bir sonraki sınıfın alt limitinden belirli bir değer (veri grubunun özelliğine göre yeteri kadar küçük bir değer) çıkarılır. Böylece sınıf aralarına değer düşmesi önlendiği gibi, bir değerin iki ayrı sınıfa dahil edilmesi de engellenmiş olur. 5. Sonuncu sınıfın üst limiti veri grubundaki en büyük değeri içine alacak şekilde belirlenir.
1-Açıklayıcı İstatistik Frekans Tabloları Frekans tablolarının düzenlenmesinde aşağıdaki sıra izlenir: 6. Sınıf limitlerinin ortalamaları alınarak sınıf değerleri (sınıf ortalamaları) belirlenir. 7. Veriler taranarak her sınıfa düşecek veri sayısı (frekans) belirlenir. Frekans tablosundaki her bir sınıf için nispi (oransal) frekans, eklemeli frekans ve eklemeli nispi(oransal) frekans değerleri hesaplanır. Nispi Frekans: bir sınıfın frekansının (n) toplam veri sayısına (N) bölünüp, 100 ile çarpılması ile elde edilir. Eklemeli Frekans: Herhangi bir sınıfın frekansı ile o sınıftan önceki sınıfların frekanslarının toplanması ile elde edilir. Eklemeli Nispi Frekans: bir sınıfın eklemeli frekansının toplam veri sayısına (N) bölünüp 100 ile çarpılmasıyla elde edilir.
1-Açıklayıcı İstatistik Frekans Tabloları Örnek 1: Bir dolum tesisinde doldurulmakta olan bakliyat paketlerinden rastgele seçilen 40 paketin ağırlıkları kg olarak aşağıda verilmiştir. Sınıf sayısını 7 alarak frekans tablosunu oluşturunuz. Nispi (izafi) frekansları, birikimli ve birikimli nispi frekansları hesaplayınız
1-Açıklayıcı İstatistik Frekans Tabloları Örnek 1 Çözüm
1-Açıklayıcı İstatistik Frekans Tabloları Örnek 1 Çözüm Frekans tablosunun tarama sütununa bakıldığında verilerin hangi değerler etrafında yoğunlaştığı ve veri grubuna ait dağılımın şekli kabaca görülmektedir
1-Açıklayıcı İstatistik Şekiller ve Grafikler Anlamlı bilgileri çıkarabilmek için şekillerin ve grafiklerin çiziminde eksenlerin orantılı olmasına ve gerekli açıklayıcı bilgileri bulundurmasına dikkat edilmelidir. Verileri şekil ve grafiklerle göstermenin yararları aşağıdaki gibi özetlenebilir: Anlaşıla bilirlik artırılır. Dikkat çekilecek hususlar belirtilir. Dağılımın biçimi hakkında bilgi sağlanır. Tahmin kolaylaşır
1-Açıklayıcı İstatistik Histogram ve Frekans Poligonları X eksenine sınıf sınırları, Y eksenine frekans değerleri yazılarak her bir sınıf için oluşturulan dikdörtgenlerin meydana getirdiği şekle histogram denir. Her bir dikdörtgenin alanı ilgili sınıfın frekansını ifade etmektedir. Örnek1’e göre oluşturulan frekans tablosunun histogramı yandaki gibi çizilebilir. Şekildeki dikdörtgenlerin orta noktalarının birleştirilmesiyle frekans poligonu elde edilir. Poligondaki kırık çizgilerin kaldırılmasıyla (bunun için gözlem sayısının yeterince artırılması gerekir) verilerin dağılım biçimi kabaca belirlenebilir.
1-Açıklayıcı İstatistik Frekans Tabloları Örnek 2 Rastgele seçilmiş 40 kişinin ağırlıkları aşağıdaki gibidir. Frekans tablosunu oluşturarak verileri özetleyiniz?
1-Açıklayıcı İstatistik Histogram ve Frekans Poligonları Dağılımın biçimine bakılarak veri grubu hakkında ilk basit değerlendirmeleri yapmak mümkündür. Sözgelimi, dağılımın simetrik değil de herhangi bir yöne çarpık olması; Örneklemenin hatalı yapıldığı, Ölçüm skalasının yanlış seçildiği, Örnek büyüklüğünün yetersiz olduğu anlamına gelebilir. Ayrıca çizilen histogramın veya frekans poligonunun tepe değerinin birden fazla olması; İlgili anakütlenin homojen olmadığını ve Örnek büyüklüğünün artırılması gerektiğini gösterir. İncelenen verilere ilişkin dağılım her zaman normal dağılım olmayabilir.
1-Açıklayıcı İstatistik Histogram ve Frekans Poligonları Yukarıdaki frekans tablosunda verilen birikimli frekans değerleri Y eksenine, sınıf üst (veya alt) sınırları X eksenine yazılır ve ilgili değerler grafiğe noktalar halinde işlenip, bu noktalar birleştirilirse aşağıdaki birikimli frekans poligonu elde edilir Birikimli frekans poligonu yardımıyla belirli orandaki değerlerin hangi değerden daha küçük veya hangi değerden daha büyük olduğu belirlenebilir.
1-Açıklayıcı İstatistik Sütun ve Pasta Grafikleri Miktarlar arasındaki ilişkiyi göstermek için X eksenine sınıf veya alt sınırlar, Y eksenine mutlak veya nispi miktarlar yerleştirilerek çizilen grafiklerdir. Örnek 2: Kamu ve özel sektörleri tarafından yapılan şeker üretiminin yıllara göre dağılımı aşağıdaki tabloda verilmiştir. Verilere ait sütun grafiğini çiziniz.
1-Açıklayıcı İstatistik Sütun Grafiği
1-Açıklayıcı İstatistik Pasta Grafiği Bir bütünü meydana getiren parçaların ifade edilmesinde kullanılan grafiklerden biri de bölünmüş daire (pasta) grafikleridir. Bu grafikleri çizerken dairenin bütün alanı %100 kabul edilir. Merkezdeki 3.6 derecelik açı %1’e karşı geldiğinden (360/100=3.6) parçaların kaçar derece açıyla gösterileceği hesaplanır. Örneğin yan tarafta çizilen ve bir üniversitedeki faaliyetlerin dağılımını gösteren bölünmüş daire grafiği şöyle yorumlanabilir: Bu üniversitedeki faaliyetlerin %65’i eğitim-öğretim, %20’si araştırma, %15’ide yayın ve halk hizmeti olarak verilmektedir
1-Açıklayıcı İstatistik Matlab Uygulamaları Örnek: Aynı beton karışımından aynı koşullar altında hazırlanmış 40 betonarme kirişin yükleme deneyinde ilk çatlağın meydana geldiği yükler aşağıdaki değerler olarak ölçülmüştür. Bu değerlere ait histogramı Matlab programı ile elde ediniz? hist(a a)
1-Açıklayıcı İstatistik Matlab Uygulamaları hist(aa,7)
1-Açıklayıcı İstatistik Kaynaklar 1- İstatistik ve Olasılık Ders Notları-Prof. Dr. İrfan KAYMAZ 2-İstatistiğe Giriş- Prof. Dr. Necati YILDIZ 3- İstatistik Analiz Metotları- Prof. Dr. Bilge ALOBA KÖKSAL 4- Mühendisler için İstatistik- Prof. Dr. Mehmetçik BAYAZIT