Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)

Benzer bir sunumlar


... konulu sunumlar: "Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)"— Sunum transkripti:

1 Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)
İstatistik eİKT-203 Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)

2 Konular Verinin görsel özetlenmesi ve histogram.
Ortalama, standart sapma ve diğer tanımlayıcı istatistikler. Kombinasyon, Permutasyon ve Olasılık. Olasılık kuramı. Kesikli rassal değişkenler. Sürekli rassal değişkenler. Normal dağılım. Örneklem dağılımı eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

3 Frekans Dağılım Tablosu
Okula geç gelme sebepleri Sebep Mazeret Sayısı Yüzdesi Trafik sıkışıklığı Ailevi sebepler Otobüsün gecikmesi Uyuya kalma Hava durumu Acil durum Toplam: (Kategorik değişkenler) eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

4 Frekans Dağılım Grafiği
Okula Geç Gelme Sebepleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

5 Pasta Grafik eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

6 Çapraz Çizelge İki kategorik ve sıralı (ordinal) değişkenin bütün kombinasyonlarını sıralayan tanlolara Çapraz Çizelge adı verilir. Eğer birinci değişken için r kategori (satır) ve ikinci değişken için de c kategori (sütun) bulunuyorsa, tabloya r x c boyutlarında çapraz çizelge denir. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

7 Çapraz Çizelge Hisse Senedi 46 55 27 128 Tahvil 32 44 19 95
Yatırımcıların tercihlerini gösteren (1.000 TL olarak) 3 x 3 lük Çapraz Çizelge Yatırım Aracı Yatırımcı Yatırımcı Yatırımcı Toplam (Kategori) Hisse Senedi Tahvil Nakit Toplam eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

8 Çok Değişkenli Grafikler
Kümelenmiş Çubuk Grafik Yatırım Tercihleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

9 Çok Değişkenli Grafikler
Yığılmış Sütun Grafik Yatırım Tercihleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

10 Çok Değişkenli Grafikler
Kümelenmiş Sütun Grafik Yatırım Tercihleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

11 Pareto Diyagramı Kategorik veriyi tanımlamak için kullanılır.
Kategorileri frekansları azalacak şekilde sıralanmış bir çubuk grafik ve birikimli (kümülatif) frekansları gösteren bir çizgi grafikten oluşur. “önemli azınlık” ile “sıradan çoğunluk” arasındaki farkı göstermek için kullanılır. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

12 İşletim Sistemi Kaynaklı
Pareto Diyagramı Örnek: 400 Çağrı sebeplerine göre ayrılmıştır: Hataların Kaynağı Çağrı Sayısı Donanım Hatası 34 Kullanıcı Hatası 223 Yazılım Hatası 25 İşletim Sistemi Kaynaklı 78 Çevre Birimi Kaynaklı 19 Network Kaynaklı 21 Total 400 eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

13 İşletim Sistemi Kaynaklı
Pareto Diyagramı 1. Adım: Hataların kaynağını azalan çağrı sayılarına göre sırala 2. Adım: Her kategorinin toplama göre %’sini hesapla Hataların Kaynağı Çağrı Sayısı Toplamın %'si Kullanıcı Hatası 223 55,75 İşletim Sistemi Kaynaklı 78 19,50 Donanım Hatası 34 8,50 Yazılım Hatası 25 6,25 Network Kaynaklı 21 5,25 Çevre Birimi Kaynaklı 19 4,75 Total 400 100,00 eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

14 Pareto Diyagramı Pareto Diyagramı Örneği
eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

15 Zaman Serisi Diyagramı
Bir değişkenin zaman içerisindeki değerlerini göstermek için Çizgi Grafik şeklinde zaman serisi diyagramı kullanılır. Yatay eksen zamanı gösterir. İlgili değişkenler de dikey eksende ölçülür. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

16 Zaman Serisi Diyagramı
Yıllara Göre Ziyaretçi Sayısı 1000 Ziyaretçi eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

17 Sayısal Verinin Gösterimi
Neden Frekans Dağılımı Kullanılır? Frekans dağılımı veriyi özetlemenin bir yoludur. Dağılım ham veriyi daha kullanışlı bir forma sıkıştırır. Verinin hızlı görsel yorumlanmasını sağlar. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

18 Histogram Her sınıf gruplandırması eşit aralıktadır
Her aralığın genişliği şu formülle belirlenir: w = (en büyük gözlem – en küçük gözlem) / istenen aralık sayısı Gözlem sayısına göre en az 5 en çok aralık oluşturun. Aralıklar örtüşmez veya boşluk bırakmazlar. Aralık genişliğini istenen uç noktalarına ulaşmak için yuvarlayın. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

19 Histogram Örnek: Kışın 20 günün sıcaklıkları (Fahrenheit cinsinden) ölçülmüş ve aşağıdaki veriler toplanmıştır. 24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

20 Histogram Ham veriyi artan şekilde sıralayın: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Aralığı hesaplayın: = 46 Sınıfların (aralıkların) sayısını belirleyin: 5 (genellikle 5 – 15 arası) Aralık genişliğini hesaplayın: 10 (46/5=9,2 ve yuvarlayın) Aralıkların sınırlarını belirleyin: 10 – 20 arası (10 dahil 20 değil), 20 – 30 arası, , 60 – 70 arası Gözlemleri sayın ve sınıfların frekanslarını bulun. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

21 Histogram Aralık Frekans Yüzde 10 – 20 arası 3 .15 15
Göreli Aralık Aralık Frekans Yüzde 10 – 20 arası 20 – 30 arası 30 – 40 arası 40 – 50 arası 50 – 60 arası Toplam eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

22 (Çubuklar arası boşluk yok)
Histogram Aralık Frekans 10 – 20 arası 20 – 30 arası 30 – 40 arası 40 – 50 arası 50 – 60 arası (Çubuklar arası boşluk yok) Sıcaklıklar (derece Fahrenheit) eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

23 Histogram Kaç aralık kullanılmalıdır? Çok (Dar sınıf aralıkları)
Aralarında boş sınıfların olduğu düzensiz görüntü verebilir. Sınıflar arasındaki frekans dağılımını iyi anlatamaz. Az (Geniş sınıf aralıkları) Değişimi çok sıkıştırıp mozaiklenmiş görüntü oluşturabilir. Önemli değişim şekillerini silebilir. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

24 Histogram Aralıkların uç noktaları nasıl belirlenmelidir?
Görsellik ve kullanıcı beğenisine bağlı olması nedeniyle kesin bir cevabı yoktur. Deneme-yanılma yoluyla belirlenir. Amaç "güzel," «göze hoş gözüken" dağılımlar ortaya çıkartmaktır. Nihayetinde verideki değişimleri gösterebilmelidir. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

25 Dal-Yaprak Diyagramı Bir veri kümesindeki dağılım detaylarını kolayca ortaya seren bir yöntemdir. YÖNTEM: Sıralanmış veri dizisini öncül (dal) ve takip eden (yapraklar) basamaklara ayırmaktır. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

26 Dal-Yaprak Diyagramı Sıralı Veri: 21 şu şeklilde 38 bu şekilde
21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Onluk basamaklarını DAL olarak kullanın: Dal Yaprak 21 şu şeklilde 38 bu şekilde gösterilir eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

27 Histogram Sıralı Veri: 2 1 4 4 6 7 7 3 0 2 8 4 1
21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Tamamlanmış Dal-Yaprak diyagramı: Dal Yapraklar 2 3 4 1 eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

28 Hatalar Yüksekliği ayarlanmamış eşit olmayan veri aralıkları.
Düşey ekseni sıkıştırmak ya da çarpıtmak. Sıfır noktasının belirtilmemesi. Verilmek istenenden farklı bir mesajın ortaya çıkması. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi


"Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)" indir ppt

Benzer bir sunumlar


Google Reklamları