Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)

Benzer bir sunumlar


... konulu sunumlar: "Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)"— Sunum transkripti:

1 Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)

2 1.  Verinin görsel özetlenmesi ve histogram.  2.Ortalama, standart sapma ve diğer tanımlayıcı istatistikler. 3.Kombinasyon, Permutasyon ve Olasılık. 4.Olasılık kuramı. 5.Kesikli rassal değişkenler. 6.Sürekli rassal değişkenler. 7.Normal dağılım. 8.Örneklem dağılımı eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

3 SebepMazeret SayısıYüzdesi Trafik sıkışıklığı 4515 Ailevi sebepler 3913 Otobüsün gecikmesi 5719 Uyuya kalma11137 Hava durumu 3311 Acil durum 15 5 Toplam: Okula geç gelme sebepleri (Kategorik değişkenler) eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

4 Okula Geç Gelme Sebepleri eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

5

6 İki kategorik ve sıralı (ordinal) değişkenin bütün kombinasyonlarını sıralayan tanlolara Çapraz Çizelge adı verilir. Eğer birinci değişken için r kategori (satır) ve ikinci değişken için de c kategori (sütun) bulunuyorsa, tabloya r x c boyutlarında çapraz çizelge denir. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

7 Yatırımcıların tercihlerini gösteren (1.000 TL olarak) 3 x 3 lük Çapraz Çizelge Yatırım Aracı 1. Yatırımcı 2. Yatırımcı 3. Yatırımcı Toplam (Kategori) Hisse Senedi Tahvil Nakit Toplam eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

8 Kümelenmiş Çubuk Grafik Yatırım Tercihleri eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

9 Yığılmış Sütun Grafik Yatırım Tercihleri eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

10 Kümelenmiş Sütun Grafik Yatırım Tercihleri eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

11 Kategorik veriyi tanımlamak için kullanılır. Kategorileri frekansları azalacak şekilde sıralanmış bir çubuk grafik ve birikimli (kümülatif) frekansları gösteren bir çizgi grafikten oluşur. “önemli azınlık” ile “sıradan çoğunluk” arasındaki farkı göstermek için kullanılır. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

12 Örnek: 400 Çağrı sebeplerine göre ayrılmıştır: Hataların KaynağıÇağrı Sayısı Donanım Hatası34 Kullanıcı Hatası223 Yazılım Hatası25 İşletim Sistemi Kaynaklı78 Çevre Birimi Kaynaklı19 Network Kaynaklı21 Total400 eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

13 1. Adım: Hataların kaynağını azalan çağrı sayılarına göre sırala 2. Adım: Her kategorinin toplama göre %’sini hesapla Hataların KaynağıÇağrı SayısıToplamın %'si Kullanıcı Hatası22355,75 İşletim Sistemi Kaynaklı7819,50 Donanım Hatası348,50 Yazılım Hatası256,25 Network Kaynaklı215,25 Çevre Birimi Kaynaklı194,75 Total400100,00 eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

14 Pareto Diyagramı Örneği eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

15 Bir değişkenin zaman içerisindeki değerlerini göstermek için Çizgi Grafik şeklinde zaman serisi diyagramı kullanılır. Yatay eksen zamanı gösterir. İlgili değişkenler de dikey eksende ölçülür. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

16 Yıllara Göre Ziyaretçi Sayısı 1000 Ziyaretçi

17 Neden Frekans Dağılımı Kullanılır? Frekans dağılımı veriyi özetlemenin bir yoludur. Dağılım ham veriyi daha kullanışlı bir forma sıkıştırır. Verinin hızlı görsel yorumlanmasını sağlar. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

18 Her sınıf gruplandırması eşit aralıktadır Her aralığın genişliği şu formülle belirlenir: w = (en büyük gözlem – en küçük gözlem) / istenen aralık sayısı Gözlem sayısına göre en az 5 en çok aralık oluşturun. Aralıklar örtüşmez veya boşluk bırakmazlar. Aralık genişliğini istenen uç noktalarına ulaşmak için yuvarlayın. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

19 Örnek: Kışın 20 günün sıcaklıkları (Fahrenheit cinsinden) ölçülmüş ve aşağıdaki veriler toplanmıştır. 24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

20 Ham veriyi artan şekilde sıralayın: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Aralığı hesaplayın: = 46 Sınıfların (aralıkların) sayısını belirleyin: 5 (genellikle 5 – 15 arası) Aralık genişliğini hesaplayın: 10 (46/5=9,2 ve yuvarlayın) Aralıkların sınırlarını belirleyin: 10 – 20 arası (10 dahil 20 değil), 20 – 30 arası,..., 60 – 70 arası Gözlemleri sayın ve sınıfların frekanslarını bulun. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

21 AralıkFrekans 10 – 20 arası – 30 arası – 40 arası – 50 arası – 60 arası Toplam Göreli Aralık Yüzde

22 eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi Sıcaklıklar (derece Fahrenheit) (Çubuklar arası boşluk yok) Aralık 10 – 20 arası 3 20 – 30 arası 6 30 – 40 arası 5 40 – 50 arası 4 50 – 60 arası 2 Frekans

23 eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi Kaç aralık kullanılmalıdır? Çok (Dar sınıf aralıkları) Aralarında boş sınıfların olduğu düzensiz görüntü verebilir. Sınıflar arasındaki frekans dağılımını iyi anlatamaz. Az (Geniş sınıf aralıkları) Değişimi çok sıkıştırıp mozaiklenmiş görüntü oluşturabilir. Önemli değişim şekillerini silebilir.

24 Aralıkların uç noktaları nasıl belirlenmelidir? Görsellik ve kullanıcı beğenisine bağlı olması nedeniyle kesin bir cevabı yoktur. Deneme-yanılma yoluyla belirlenir. Amaç "güzel," «göze hoş gözüken" dağılımlar ortaya çıkartmaktır. Nihayetinde verideki değişimleri gösterebilmelidir. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

25 Bir veri kümesindeki dağılım detaylarını kolayca ortaya seren bir yöntemdir. YÖNTEM: Sıralanmış veri dizisini öncül (dal) ve takip eden (yapraklar) basamaklara ayırmaktır. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi

26 Onluk basamaklarını DAL olarak kullanın: Sıralı Veri: 21, 24, 24, 26, 27, 27, 30, 32, 38, şu şeklilde 38 bu şekilde gösterilir Dal Yaprak

27 eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi Tamamlanmış Dal-Yaprak diyagramı: DalYapraklar Sıralı Veri: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41

28 Yüksekliği ayarlanmamış eşit olmayan veri aralıkları. Düşey ekseni sıkıştırmak ya da çarpıtmak. Sıfır noktasının belirtilmemesi. Verilmek istenenden farklı bir mesajın ortaya çıkması. eİKT 203 – İstatistikHafta: 02 – Verinin Görsel Analizi


"Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)" indir ppt

Benzer bir sunumlar


Google Reklamları