Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Sayısal Tanımlayıcı Teknikler

Benzer bir sunumlar


... konulu sunumlar: "Sayısal Tanımlayıcı Teknikler"— Sunum transkripti:

1 Sayısal Tanımlayıcı Teknikler
B Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ

2 SAYISAL TANIMLAYICI TEKNİKLER

3 MERKEZİ EĞİLİM ÖLÇÜTLERİ
Aritmetik Ortalama: Basit şekli ile bütün gözlem değerlerinin toplam gözlem adedine bölünmesi ile hesaplanır. 𝜇=𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎𝑠𝚤, 𝑥 =Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎𝑠𝚤 Uç (Aykırı) değerlerden etkilenir. Medyan (Ortanca): Önceden sıralanmış veri seti içerisindeki tam orta değerdir. Eğer gözlem sayısı çift ise ortada bulunan iki değerin ortalaması medyan olarak kabul edilir.

4 MERKEZİ EĞİLİM ÖLÇÜTLERİ
Mod En yüksek frekansa sahip olan gözlem değeridir. Merkezi eğilim ölçütü olarak kullanılmasında bazı sıkıntılar olabilir. Eğer örnek sayısı çok az ise uygun sonuç üretmeyebilir. Bazı durumlarda tek değildir. Geometrik Ortalama: Bir veri setindeki aykırı değerlerin etkisini minimize edebilmek için geometrik ortalama kullanılır. 𝜇= =47,13 𝐺= 8 45∗37∗40∗30∗35∗45∗50∗95 =44,34

5 DEĞİŞKENLİK ÖLÇÜTLERİ
Merkezi eğilim ölçüleri dağılım hakkında bilgi vermez. Bir veri setinin ortalamasının ne olduğu kadar, verilerin bu ortalama etrafında nasıl değişkenlik gösterdiğinin de bilinmesi önemlidir. Yandaki örnekten de anlaşılacağı üzere, mavi ve kırmızı sınıfların bir dersten aldığı ortalamalar aynı olmakla beraber, farkı değişkenlikleri oldukları görsel olarak söylenebilir.

6 DEĞİŞKENLİK ÖLÇÜTLERİ
Dağılım Aralığı: Dağılım aralığı en basit değişkenlik ölçütüdür. 𝐷𝑎ğ𝚤𝑙𝚤𝑚 𝐴𝑟𝑎𝑙𝚤ğ𝚤=𝐸𝑛 𝐵ü𝑦ü𝑘 𝐷𝑒ğ𝑒𝑟−𝐸𝑛 𝐾üçü𝑘 𝐷𝑒ğ𝑒𝑟 Avantaj : Basitlik Dezavantaj : Basitlik Set 1 : 4, 4, 4, 4, 4, 50 𝐷𝑎ğ𝚤𝑙𝚤𝑚 𝐴𝑟𝑎𝑙𝚤ğ𝚤=50−4=46 Set 2 : 4, 8, 15, 24, 39, 50

7 DEĞİŞKENLİK ÖLÇÜTLERİ
Varyans: Bir veri setindeki her bir değerin ortalamadan uzaklıklarının karelerinin, ortalaması şeklinde hesaplanır. Varyans beklenen değer ile (Bütçe) gözlenen değer (Harcama) arasındaki farktır. Yapılması gereken ile yapılan arasındaki farktır. 𝜎 2 =𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑉𝑎𝑟𝑦𝑎𝑛𝑠𝚤 𝑠 2 =Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑉𝑎𝑟𝑦𝑎𝑛𝑠𝚤

8 DEĞİŞKENLİK ÖLÇÜTLERİ
Standart Sapma: Ortalama veya beklenen değerden ne ölçüde sapma olduğunu gösterir. Düşük standart sapma değerleri verilerin ortalamaya daha yakın seyrettiğini gösterir. Yüksek değerlerde ise veriler o kadar ortalamadan uzaklaşır. 𝜎=𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑆𝑡𝑎𝑛𝑑𝑎𝑟𝑡 𝑆𝑎𝑝𝑚𝑎𝑠𝚤 𝑠=Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑆𝑡𝑎𝑛𝑑𝑎𝑟𝑡 𝑆𝑎𝑝𝑚𝑎𝑠𝚤

9 DEĞİŞKENLİK ÖLÇÜTLERİ
Eğer Histogram Çan eğrisi şeklinde (simetrik ise) bütün değerleri % 68’i tek, %95’i çift ve %99,7 si üç standart sapma aralığındadır.

10 DEĞİŞKENLİK ÖLÇÜTLERİ
Değişkenlik Katsayısı: Değişkenlik katsayısı standart sapmanın aritmetik ortalamaya bölünmesi ile elde edilen yüzdesel bir orandır 𝐶𝑉= 𝜎 2 𝜇 𝑣𝑒𝑦𝑎 𝐶𝑉= 𝑠 2 𝑥 Örneklem 1 Ortalama = 141 Standart Sapma = 12 Değişkenlik Katsayısı = 12/141 = 0,0851 Örneklem 2 Ortalama = 136 Değişkenlik Katsayısı = 12/136 = 0,0882 Örneklem 3 Standart Sapma = 10 Değişkenlik Katsayısı = 10/136 = 0,0735

11 GÖRECELİ DURUM ÖLÇÜTLERİ
Persentil: Bir değişkenin gözlem değerleri arasındaki belirli yüzdelik dilimi belirleyen değerdir. Çeyreklik: 𝑄 1 =İ𝑙𝑘 𝑣𝑒𝑦𝑎 𝑎𝑙𝑡 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘(%25 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝑄 2 =İ𝑘𝑖𝑛𝑐𝑖 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘 𝑀𝑒𝑑𝑦𝑎𝑛 ((%50 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝑄 3 =Üçü𝑛𝑐ü 𝑣𝑒𝑦𝑎 ü𝑠𝑡 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘((%75 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝐵𝑖𝑟 𝑦ü𝑧𝑑𝑒𝑙𝑖𝑘 𝑑𝑒ğ𝑒𝑟𝑖𝑛 𝑘𝑜𝑛𝑢𝑚𝑢= 𝐿 𝑝 =(𝑛+1) 𝑃 100

12 GÖRECELİ DURUM ÖLÇÜTLERİ
Örnek Bir grup çalışanın ağırlık değerleri aşağıda verilmiştir: %25 lik dilime karşılık gelen değeri ( 𝑄 1 ) bulunuz %50 lik dilime karşılık gelen değeri ( 𝑄 2 ) bulunuz. %75 lik dilime karşılık gelen değeri ( 𝑄 3 ) bulunuz.

13 GÖRECELİ DURUM ÖLÇÜTLERİ
Örnek 𝐿 𝑝 = 𝑛+1 𝑃 100 = =6.5 𝑄 1 = =161 𝑄 2 =𝑀𝑒𝑑𝑖𝑎𝑛=169 𝐿 𝑝 = 𝑛+1 𝑃 100 = =19.5 𝑄 3 = =178

14 GÖRECELİ DURUM ÖLÇÜTLERİ
5 Nokta Yöntemi: 5 sayı yöntemi 𝑄 1 , 𝑄 2 , 𝑄 3 çeyreklik değerleri ile birlikte veri setindeki en küçük (S) ve en büyük değerin (L) birlikte sunulduğu bir tanımlayıcı istatistik yöntemidir. En Küçük Değer (S) Birinci Çeyreklik ( 𝑸 𝟏 ) Medyan ( 𝑸 𝟐 ) Üçüncü Çeyreklik ( 𝑸 𝟑 ) En büyük Değer (L)

15 GÖRECELİ DURUM ÖLÇÜTLERİ
Kutu Grafiği: Temelde 5 Nokta yöntemine dayanan kutu grafiği veri setinin değişkenliği ve hangi aralıkta değiştiği ile ilgili önemli yorumlar sunar. Kutu grafiği uç değerleri, medyanı (dağılım simetrikse ortalamayı) ve dağılımı birlikte sunduğunda kuvvetli bir görsel tanımlama aracıdır.5 farklı değer grafik üzerinde sunulur.

16 GÖRECELİ DURUM ÖLÇÜTLERİ
Kutu Grafiği: Çeyreklikler arası uzaklık: Alt ve üste çeyreklikler arasındaki uzaklığı belirtir. Ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘𝑙𝑒𝑟 𝑎𝑟𝑎𝑠𝚤 𝑢𝑧𝑎𝑘𝑙𝚤𝑘=𝐼𝑄𝑅= 𝑄 3 − 𝑄 1 Çubuklar (Whiskers): Soldan sağa doğru uzayan doğrusal çizgi. Sola doğru 𝑄 1 −1,5∗𝐼𝑄𝑅 kadar uzar. Veri setindeki en küçük değerden daha sola gidemez. Sağa doğru 𝑄 2 +1,5∗𝐼𝑄𝑅 kadar uzar. Veri setindeki en büyük değerden daha sağa gidemez.

17 GÖRECELİ DURUM ÖLÇÜTLERİ
Örnek: Önceki örnekteki veriyi görselleştirelim.

18 GÖRECELİ DURUM ÖLÇÜTLERİ
Wendy’s firmasının servis süresi en kısa ve en az değişkenlik gösterendir. Hardee’s en yüksek değişkenlik değerine ulaşır. Jack-in-the-Box en uzun servis süresine sahiptir.

19 SPSS DE TANIMLAYICI İSTATİSTİKLER
SPSS içerisinde sayısal tanımlayıcı istatistikler Analyze içerisinde yer alana Descriptives alanında bulunur. Bütün istatistikleri Bu alanda yer alana geçtiğimiz hafta işlediğimiz Frequencies analizinden elde edilir. EXCEL içerisinde kullandığımız 25 öğrenciye ait boyları SPSS içerisine girerek BOY adı altında Scale measure yapısında bir değişken oluşturuyoruz. Daha sonra yukarıda belirtilen Freequencies / Statistics tabına basılır.

20 SPSS DE TANIMLAYICI İSTATİSTİKLER
Bu ekranda merkezi eğilim ölçütlerinden Aritmetik Ortalama, Mod ve Medyan yer alırken, Değişkenlik ölçütlerinden Değişim aralığı, varyans ve standart sapma bulunmaktadır. Göreceli durum ölçütlerinden persentillerde de yine bu ekrandan seçilebilir. Çeyreklikler Quartiles alanından seçilebilirken, istenirse Cuts point for …. Equal groups kısmından eşit aralıklı persentil değerleri alınabilir.

21 SPSS DE TANIMLAYICI İSTATİSTİKLER
Kutu Grafiği Oluşturma Kutu grafiği karşılaştırma amaçlı kullanılan bir diyagram olduğundan Boy veri setinekarşılaştırma ölçütü olarak Cinsiyeti değişkeni (Nominal) de eklenmelidir. Graphs> Legacy Dialogs > Box Plot seçimi yapılıp aşağıdaki ayarlar gerçekleştirilir.

22 AMAN DİKKAT Kategorik veriler için sayısal tanımlayıcı teknikleri kullanmayın. Bazı kategorik değişkenler sayısal formda sunulsa da bu durum o değişkenlerin kantitatif yani nominal oldukları manasına gelmez. Bazı durumlarda birden fazla mod değerine rastlanabilir. Bu şekildeki durumlarda diğer tanımlayıcı istatistiklere yönelin. Verilerin içerisinde aykırı değer olup olmadığını sorgulayın. Bu durum sonucunda kullanılacak tanımlayıcı yöntemi seçin.


"Sayısal Tanımlayıcı Teknikler" indir ppt

Benzer bir sunumlar


Google Reklamları