Sayısal Tanımlayıcı Teknikler

Slides:



Advertisements
Benzer bir sunumlar
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Advertisements

MERKEZİ YIĞILMA (EĞİLİM) ÖLÇÜLERİ
Analysis of Variance/Multiple ANOVA
İstatistik Tahmin ve Güven aralıkları
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
Hafta 10: Sürekli Rassal Değişkenler (Yrd.Doç.Dr. Levent AKSOY)
Hafta 07: Kesikli Değişkenler (Yrd.Doç.Dr. Levent AKSOY)
Tanımlayıcı İstatistikler
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
Tıp alanında kullanılan temel istatistiksel kavramlar
VERİLERİN GRAFİKLERLE GÖSTERİLMESİ
Normal Dağılım.
TIPTA ÇALIŞMA DÜZENLERİ VE İSTATİSTİKTE TEMEL KAVRAMLAR
VERİLERİN DÜZENLENMESİ VE ORGANİZASYONU
İstatistikte Bazı Temel Kavramlar
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
yunus.hacettepe.edu.tr/~tonta/courses/spring2008/bby208/
TANIMLAYICI İSTATİSTİKLER
Merkezi Eğilim (Yer) Ölçüleri
Betimleyici İstatistik – I
Merkezi Eğilim (Yer) Ölçüleri
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Varyasyon Katsayısı
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
Hafta 05: Olasılık Kuramı (Yrd.Doç.Dr. Levent AKSOY)
Hafta 06: Olasılık Kuramı (Yrd.Doç.Dr. Levent AKSOY)
DEĞİŞKENLİK ÖLÇÜLERİ.
Yrd. Doç. Dr. Hamit ACEMOĞLU
Uygulama I.
Asimetri ve Basıklık Ölçüleri
Sıklık Tabloları ve Tek Değişkenli Grafikler
KISIM II Matematiksel Kavram ve Prosedürlerin Gelişimi BÖLÜM 21 Veri Analizi Kavramlarının Gelişimi.
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistik
Tanımlayıcı İstatistikler
Bilişim Teknolojileri için İşletme İstatistiği
ÖĞRENME AMAÇLARI Veri analizi kavramı ve sağladığı işlevleri hakkında bilgi edinmek Pazarlama araştırmalarında kullanılan istatistiksel analizlerin.
Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ B.
Bilişim Teknolojileri için İşletme İstatistiği
Bilişim Teknolojileri için İşletme İstatistiği
Bilişim Teknolojileri için İşletme İstatistiği
İstatistik Bilimine Giriş
Uygulama 3.
Asimetri ve Basıklık Ölçüleri
DEĞİŞKENLİK (Yayıklık) ÖLÇÜLERİ
Non Parametrik Hipotez Testleri
Analitik olmayan ortalamalar
Bölüm 03 Sayısal Tanımlama Teknikleri
Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ B.
Merkezi Eğilim (Yığılma) Ölçüleri
Maliye’de SPSS Uygulamaları
Tanımlayıcı Ölçütler Üzerinde durulan bir çalışmada amaç; elde edilen veri setini bir ya da birkaç ölçü ile özetlemektir. Kullanılan her ölçü dağılımın.
SU KALİTESİ VERİLERİNİN İSTATİSTİKSEL YÖNTEMLERLE DEĞERLENDİRİLMESİ

Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
Ölçme ve Değerlendirme
ARAŞTIRMA YÖNTEM ve TEKNİKLERİ
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Merkezi Eğilim Ölçüleri
İSTATİSTİĞE GİRİŞ.
SPSS Uygulamaları Parametrik İstatistik
DEĞİŞKENLİK ÖLÇÜLERİ.
DEĞİŞKENLİK ÖLÇÜLERİ.
Uygulama I.
Tıp Fakültesi UYGULAMA 2
İstatistik Ders Notları.
2.Hafta Dağılım İç tutarlılık Tek Örneklem t Testi
Sunum transkripti:

Sayısal Tanımlayıcı Teknikler B Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ

SAYISAL TANIMLAYICI TEKNİKLER

MERKEZİ EĞİLİM ÖLÇÜTLERİ Aritmetik Ortalama: Basit şekli ile bütün gözlem değerlerinin toplam gözlem adedine bölünmesi ile hesaplanır. 𝜇=𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎𝑠𝚤, 𝑥 =Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎𝑠𝚤 Uç (Aykırı) değerlerden etkilenir. Medyan (Ortanca): Önceden sıralanmış veri seti içerisindeki tam orta değerdir. Eğer gözlem sayısı çift ise ortada bulunan iki değerin ortalaması medyan olarak kabul edilir.

MERKEZİ EĞİLİM ÖLÇÜTLERİ Mod En yüksek frekansa sahip olan gözlem değeridir. Merkezi eğilim ölçütü olarak kullanılmasında bazı sıkıntılar olabilir. Eğer örnek sayısı çok az ise uygun sonuç üretmeyebilir. Bazı durumlarda tek değildir. Geometrik Ortalama: Bir veri setindeki aykırı değerlerin etkisini minimize edebilmek için geometrik ortalama kullanılır. 𝜇= 45+37+40+30+35+45+50+95 8 =47,13 𝐺= 8 45∗37∗40∗30∗35∗45∗50∗95 =44,34

DEĞİŞKENLİK ÖLÇÜTLERİ Merkezi eğilim ölçüleri dağılım hakkında bilgi vermez. Bir veri setinin ortalamasının ne olduğu kadar, verilerin bu ortalama etrafında nasıl değişkenlik gösterdiğinin de bilinmesi önemlidir. Yandaki örnekten de anlaşılacağı üzere, mavi ve kırmızı sınıfların bir dersten aldığı ortalamalar aynı olmakla beraber, farkı değişkenlikleri oldukları görsel olarak söylenebilir.

DEĞİŞKENLİK ÖLÇÜTLERİ Dağılım Aralığı: Dağılım aralığı en basit değişkenlik ölçütüdür. 𝐷𝑎ğ𝚤𝑙𝚤𝑚 𝐴𝑟𝑎𝑙𝚤ğ𝚤=𝐸𝑛 𝐵ü𝑦ü𝑘 𝐷𝑒ğ𝑒𝑟−𝐸𝑛 𝐾üçü𝑘 𝐷𝑒ğ𝑒𝑟 Avantaj : Basitlik Dezavantaj : Basitlik Set 1 : 4, 4, 4, 4, 4, 50 𝐷𝑎ğ𝚤𝑙𝚤𝑚 𝐴𝑟𝑎𝑙𝚤ğ𝚤=50−4=46 Set 2 : 4, 8, 15, 24, 39, 50

DEĞİŞKENLİK ÖLÇÜTLERİ Varyans: Bir veri setindeki her bir değerin ortalamadan uzaklıklarının karelerinin, ortalaması şeklinde hesaplanır. Varyans beklenen değer ile (Bütçe) gözlenen değer (Harcama) arasındaki farktır. Yapılması gereken ile yapılan arasındaki farktır. 𝜎 2 =𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑉𝑎𝑟𝑦𝑎𝑛𝑠𝚤 𝑠 2 =Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑉𝑎𝑟𝑦𝑎𝑛𝑠𝚤

DEĞİŞKENLİK ÖLÇÜTLERİ Standart Sapma: Ortalama veya beklenen değerden ne ölçüde sapma olduğunu gösterir. Düşük standart sapma değerleri verilerin ortalamaya daha yakın seyrettiğini gösterir. Yüksek değerlerde ise veriler o kadar ortalamadan uzaklaşır. 𝜎=𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑆𝑡𝑎𝑛𝑑𝑎𝑟𝑡 𝑆𝑎𝑝𝑚𝑎𝑠𝚤 𝑠=Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑆𝑡𝑎𝑛𝑑𝑎𝑟𝑡 𝑆𝑎𝑝𝑚𝑎𝑠𝚤

DEĞİŞKENLİK ÖLÇÜTLERİ Eğer Histogram Çan eğrisi şeklinde (simetrik ise) bütün değerleri % 68’i tek, %95’i çift ve %99,7 si üç standart sapma aralığındadır.

DEĞİŞKENLİK ÖLÇÜTLERİ Değişkenlik Katsayısı: Değişkenlik katsayısı standart sapmanın aritmetik ortalamaya bölünmesi ile elde edilen yüzdesel bir orandır 𝐶𝑉= 𝜎 2 𝜇 𝑣𝑒𝑦𝑎 𝐶𝑉= 𝑠 2 𝑥 Örneklem 1 Ortalama = 141 Standart Sapma = 12 Değişkenlik Katsayısı = 12/141 = 0,0851 Örneklem 2 Ortalama = 136 Değişkenlik Katsayısı = 12/136 = 0,0882 Örneklem 3 Standart Sapma = 10 Değişkenlik Katsayısı = 10/136 = 0,0735

GÖRECELİ DURUM ÖLÇÜTLERİ Persentil: Bir değişkenin gözlem değerleri arasındaki belirli yüzdelik dilimi belirleyen değerdir. Çeyreklik: 𝑄 1 =İ𝑙𝑘 𝑣𝑒𝑦𝑎 𝑎𝑙𝑡 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘(%25 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝑄 2 =İ𝑘𝑖𝑛𝑐𝑖 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘 𝑀𝑒𝑑𝑦𝑎𝑛 ((%50 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝑄 3 =Üçü𝑛𝑐ü 𝑣𝑒𝑦𝑎 ü𝑠𝑡 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘((%75 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝐵𝑖𝑟 𝑦ü𝑧𝑑𝑒𝑙𝑖𝑘 𝑑𝑒ğ𝑒𝑟𝑖𝑛 𝑘𝑜𝑛𝑢𝑚𝑢= 𝐿 𝑝 =(𝑛+1) 𝑃 100

GÖRECELİ DURUM ÖLÇÜTLERİ Örnek Bir grup çalışanın ağırlık değerleri aşağıda verilmiştir: %25 lik dilime karşılık gelen değeri ( 𝑄 1 ) bulunuz %50 lik dilime karşılık gelen değeri ( 𝑄 2 ) bulunuz. %75 lik dilime karşılık gelen değeri ( 𝑄 3 ) bulunuz.

GÖRECELİ DURUM ÖLÇÜTLERİ Örnek 𝐿 𝑝 = 𝑛+1 𝑃 100 = 25+1 25 100 =6.5 𝑄 1 = 160+162 2 =161 𝑄 2 =𝑀𝑒𝑑𝑖𝑎𝑛=169 𝐿 𝑝 = 𝑛+1 𝑃 100 = 25+1 75 100 =19.5 𝑄 3 = 177+179 2 =178

GÖRECELİ DURUM ÖLÇÜTLERİ 5 Nokta Yöntemi: 5 sayı yöntemi 𝑄 1 , 𝑄 2 , 𝑄 3 çeyreklik değerleri ile birlikte veri setindeki en küçük (S) ve en büyük değerin (L) birlikte sunulduğu bir tanımlayıcı istatistik yöntemidir. En Küçük Değer (S)   Birinci Çeyreklik ( 𝑸 𝟏 ) Medyan ( 𝑸 𝟐 ) Üçüncü Çeyreklik ( 𝑸 𝟑 ) En büyük Değer (L)

GÖRECELİ DURUM ÖLÇÜTLERİ Kutu Grafiği: Temelde 5 Nokta yöntemine dayanan kutu grafiği veri setinin değişkenliği ve hangi aralıkta değiştiği ile ilgili önemli yorumlar sunar. Kutu grafiği uç değerleri, medyanı (dağılım simetrikse ortalamayı) ve dağılımı birlikte sunduğunda kuvvetli bir görsel tanımlama aracıdır.5 farklı değer grafik üzerinde sunulur.

GÖRECELİ DURUM ÖLÇÜTLERİ Kutu Grafiği: Çeyreklikler arası uzaklık: Alt ve üste çeyreklikler arasındaki uzaklığı belirtir. Ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘𝑙𝑒𝑟 𝑎𝑟𝑎𝑠𝚤 𝑢𝑧𝑎𝑘𝑙𝚤𝑘=𝐼𝑄𝑅= 𝑄 3 − 𝑄 1 Çubuklar (Whiskers): Soldan sağa doğru uzayan doğrusal çizgi. Sola doğru 𝑄 1 −1,5∗𝐼𝑄𝑅 kadar uzar. Veri setindeki en küçük değerden daha sola gidemez. Sağa doğru 𝑄 2 +1,5∗𝐼𝑄𝑅 kadar uzar. Veri setindeki en büyük değerden daha sağa gidemez.

GÖRECELİ DURUM ÖLÇÜTLERİ Örnek: Önceki örnekteki veriyi görselleştirelim.

GÖRECELİ DURUM ÖLÇÜTLERİ Wendy’s firmasının servis süresi en kısa ve en az değişkenlik gösterendir. Hardee’s en yüksek değişkenlik değerine ulaşır. Jack-in-the-Box en uzun servis süresine sahiptir.

SPSS DE TANIMLAYICI İSTATİSTİKLER SPSS içerisinde sayısal tanımlayıcı istatistikler Analyze içerisinde yer alana Descriptives alanında bulunur. Bütün istatistikleri Bu alanda yer alana geçtiğimiz hafta işlediğimiz Frequencies analizinden elde edilir. EXCEL içerisinde kullandığımız 25 öğrenciye ait boyları SPSS içerisine girerek BOY adı altında Scale measure yapısında bir değişken oluşturuyoruz. Daha sonra yukarıda belirtilen Freequencies / Statistics tabına basılır.

SPSS DE TANIMLAYICI İSTATİSTİKLER Bu ekranda merkezi eğilim ölçütlerinden Aritmetik Ortalama, Mod ve Medyan yer alırken, Değişkenlik ölçütlerinden Değişim aralığı, varyans ve standart sapma bulunmaktadır. Göreceli durum ölçütlerinden persentillerde de yine bu ekrandan seçilebilir. Çeyreklikler Quartiles alanından seçilebilirken, istenirse Cuts point for …. Equal groups kısmından eşit aralıklı persentil değerleri alınabilir.

SPSS DE TANIMLAYICI İSTATİSTİKLER Kutu Grafiği Oluşturma Kutu grafiği karşılaştırma amaçlı kullanılan bir diyagram olduğundan Boy veri setinekarşılaştırma ölçütü olarak Cinsiyeti değişkeni (Nominal) de eklenmelidir. Graphs> Legacy Dialogs > Box Plot seçimi yapılıp aşağıdaki ayarlar gerçekleştirilir.

AMAN DİKKAT Kategorik veriler için sayısal tanımlayıcı teknikleri kullanmayın. Bazı kategorik değişkenler sayısal formda sunulsa da bu durum o değişkenlerin kantitatif yani nominal oldukları manasına gelmez. Bazı durumlarda birden fazla mod değerine rastlanabilir. Bu şekildeki durumlarda diğer tanımlayıcı istatistiklere yönelin. Verilerin içerisinde aykırı değer olup olmadığını sorgulayın. Bu durum sonucunda kullanılacak tanımlayıcı yöntemi seçin.