Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

İSTATİSTİK 1 VERİLERİN DÜZENLENMESİ VE SUNUMU Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

Benzer bir sunumlar


... konulu sunumlar: "İSTATİSTİK 1 VERİLERİN DÜZENLENMESİ VE SUNUMU Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK"— Sunum transkripti:

1 İSTATİSTİK 1 VERİLERİN DÜZENLENMESİ VE SUNUMU Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

2 VERİLERİN DÜZENLENMESİ VE SUNUMU  Hangi yöntemle elde edilirse edilsin elimize ulaşan veriler ham veri olarak adlandırılır.  Bu verilerin analize uygun hale getirilmeleri için düzenlenmeleri ve sıralanmaları gerekir. Bunlarda bize serileri verir.  Toplanan veriler kolay ve anlaşılır bir biçimde düzenlenmelidir.  Bu düzenleme çeşitli şekillerde yapılabilir.  Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden faydalanılır. 2

3 VERİLERİN DÜZENLENMESİ VE SUNUMU Seriler;  Zaman serileri  Mekan serileri  Dağılım serileri  Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir.  Sınıflanmış seri: Sınıflanmış serilerde tekrarlanan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir.  Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir. 3

4 Zaman serisi 4 Verileri gün, hafta, ay, yıl gibi zaman vasfının şıklarına göre düzenlenmiş olarak gösteren serilerdir. Zaman serisi iki sütundan oluşur. Birinci sütunda zaman vasfının şıkları, ikinci sütunda ise olaya ait değerler bulunur. Örnek: Yıllara göre Türkiye nüfusu YıllarNüfus(milyon) , , , , ,6

5 Mekan serisi 5 Toplanan verileri mekan vasfının şıklarına göre sıralanmış olarak gösteren seriler mekan serileri adını alır. Mekan vasfının şıkları ülke, bölge, il, ilçe, köy gibi şıklar olabilir. Seri iki sütundan oluşur. İlk sütunda mekan vasfının şıkları, ikici sütunda değerler bulunur. Örnek: İllere göre 1970 yılı nüfus değerleri İllerNüfus(bin kişi) İstanbul3.019 Ankara İzmir Adana Bursa 848

6 Dağılım serileri 6 Zaman ve mekan vasfının dışında kalan maddi değişken olarak tanınan değişkenlerin şıklarına göre düzenlenmiş seriler dağılım serileridir. Bir sınıftaki öğrencilerin aldığı notlar, boy uzunluğu, ağırlık, işçi sayısı gibi özellikler örnek verilebilir. Dağılım serileri sayısal olmayan özelliklere göre de düzenlenebilir. Ancak sayısal özelliklere göre düzenlenmiş dağılım serileri daha çok kullanılmaktadır. Bu tür dağılım serileri 3 sınıfta toplanabilir.  Basit seriler  Frekanslı/Sınıflanmış (tasnif edilmiş) seriler  Gruplanmış seriler

7 7 Dağılım Serileri Basit seriSınıflı/Frekanslı seriGruplu seri

8 Basit Seri 8 Araştırma veya analizlerde kullanılmak üzere elde edilen veri sayısı az ise bu tür veri yapılarına BASİT SERİ adı verilir. Verilerin büyükten küçüğe veya küçükten büyüğe sıralanmasıyla oluşturulan seridir. Örnek: 7 öğrencinin bir dersten devamsızlık sayıları 3,4,6,1,5,2,4 olsun. Verileri küçükten büyüğe doğru sıraladığımızda; basit seri; 1,2,3,4,4,5,6 elde edilir.

9 Basit Seri 9 Örnek: Bir işletmede çalışan 25 işçiye verilecek çocuk paraları ile ilgili bir araştırma yapılmaktadır. İşçilerin çocuk sayıları aşağıda verilmiştir. 1,3,2,2,3,1,4,5,3,6,0,5,2,3,2,4,8,0,1,2,3,3,1,0,4 Verilen değerleri basit seri şeklinde düzenleyelim. 0,0,0,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,4,4,4,5,5,6,8

10 Basit Seri 10

11 Basit Seri 11 Notlar(x i ) Örnek: 12 öğrencinin bir dersten aldığı notlar; 50, 65, 0, 30, 25, 50, 30, 45, 90, 70, 50, 75

12 VERİLERİN DÜZENLENMESİ VE SUNUMU 12

13 VERİLERİN DÜZENLENMESİ VE SUNUMU 13  Basit seride veriler küçükten büyüğe doru sıralanır.  18, 20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 29, 29, 30, 31, 32, 32  Basit seriler bazı küçük düzenlemelerle frekanslı seriye dönüştürülebilir

14 Frekanslı seri Notlar(x i )Frekanslar(n i ) Gözlem sonuçlarının düzenlenerek birinci sütunda olaya ait değerleri, ikinci sütunda frekansları gösterecek şekilde hazırlanırsa sınıflanmış seri elde edilir. Örnek: 12 öğrencinin bir derse ait notları (basit seri için verilen örnek) ve frekansları Not; frekans değerlerinin toplamının gözlem sayısına eşit olması gerekir.

15 15 Frekanslı Seri Değişkenlerin çeşitli şıklarının kütlede kaç defa tekrarlandığını gösteren sayılar frekans adını alır. İncelenecek birim sayısının artması ile basit seriler yan yana veya alt alta yazılmış uzun sayı dizileri oluşturulacaktır. Bu durumda çalışma kolaylığı sağlaması için frekans serileri düzenlenir. xifi Toplam 25 Örnek: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz. Basit seri; 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 6, 8

16 16 Frekans Serilerinin Grafikle Gösterilmesi

17 Frekanslı seri 17 Basit seri  18, 20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 29, 29, 30, 31, 32, 32 Ele alınan değişkenin şıkları çok sayıda ise sınıflamada sorun çıkabilir. Bu durumda gruplamaya başvurulur. X (satış adedi) toplam30

18 18 Gruplama  Bir değişkenin birbirine yakın olan şıklarını bir araya getirmeye gruplama denir.  Örneğin meslek istatistikleri yapılırken serbest çalışan doktor, avukat, dişçi, tüccar gibi meslekler “serbest meslekler” grubuna alınmaktadır.  Gruplama ile toplanan veriler hakkında daha geniş ve açık bilgiler alınabileceği gibi, her gruba düşen frekans sayısı da büyür.  Gruplamanın bu yararları yanında bazı sakıncaları da vardır.  Örneğin grup sınırlarının belirtilmesi önemli bir sorundur.

19 Kesikli değişkenlerde gruplu seri sınıflar toplam30 k=5  Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur.  Yandaki seride KOBİ’lerde çalışan işçi sayısı değişkeni kesikli bir özelliğe sahiptir.  Bu değişken tamsayı dışında değerler almaz.  Bu sebeple sınıflar arası boşluklar oluşur. Çalışan İşçi Sayısı KOBİ Sayısı 5 – – – – – 545 (32-18)/5=2.8

20 Gruplanmış seri

21 Gramaj verileri Oluşturulan frekanslı seri Paketlerin gramajları frekanslar

22 Gruplanmış seri Oluşturulan frekanslı seri Sürekli değişkene ait gruplu seri Paketlerin gramajları frekanslar sınıflar den az dan az den az den az den az den az dan az3 toplam30

23 sınıf orta noktası: sınıf orta noktası: sınıfı iki eşit parçaya bölen nokta. Üst ve alt limitin orta noktasıdır. Sınıf frekansı: her bir sınıftaki gözlem sayısıdır Sınıf aralığı: üst sınıf limitinin alt sınıf limitinden çıkarılması ile elde edilen değer Sınıf aralığı: üst sınıf limitinin alt sınıf limitinden çıkarılması ile elde edilen değer.

24 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, Veriyi sınıflandırıp frekans tablosunu oluşturunuz. Bir işletme fakültesi dekanı öğrencilerin haftalık kaç saat çalıştıklarıyla ilgili bir çalışma yapıyor. 30 öğrenciyi tesadüfi olarak seçiyor ve onların geçen hafta kaç saat çalıştıklarını kaydediyor.

25 Adım 1 : Adım 1 : kaç tane sınıf kullanacağına aşağıdaki formülle belirle 2 k > n k=sınıf sayısı n=gözlem sayısı

26 H=verideki en büyük değer, L=verideki en küçük değer, k=sınıf sayısı 33.8 – = 4.7 Adım 2 Adım 2: sınıf aralığını (i) aşağıdaki formülü kullanarak bul H – L k i > = Çıkan sonucu 5’e yuvarla İlk sınıfın alt sınırını 10 olarak belirle ve 5 sınıf oluştur.

27 Adım 3 Adım 3: herbir sınıf için limitleri belirle ve frekans dağılımını oluştur

28 Sınıf orta noktası Sınıf orta noktası : aşağıdaki formülü kullanarak sınıf orta noktasını hesapla Ust limit + alt limit 2

29 Nisbi frekans dağılımı herbir sınıftaki frekansın toplam frekanstaki oranını verir

30 Örnek: Frekans tablosunu oluşturma  Adım 1: sınıf sayısını belirle 2 k > n. Formülünü uygula 80 araç satıldığından uygun sınıf sayısı en az 7 olmalı.  Adım 2: sınıf aralığını belirle i  (H-L)/k formülünü kullandığımızda sınıf aralığı ($35,925 - $15,546)/7 = $2,911 olarak bulunur Bu rakamı yukarıya 10 veya 100’ün katları şeklinde yuvarla

31 Örnek: Frekans tablosunu oluşturma  Adım 3: sınıf sınırlarını oluştur ve frekans tablosunu oluştur

32 Frekans tablosunu oluştur

33 Nisbi frekans dağılımı

34 Bir verinin gruplanmış seriye dönüştürülmesi Öğrencilerin notları  Xmin: 25 Xmax: 95  Serinin sınıf aralıkları 11 birim olacak şekilde gruplanması uygun olacaktır.

35 Bir verinin gruplanmış seriye dönüştürülmesi NotlarÖğrenci sayısı dan az “ “ “ “ “ “ “ “ “ “2

36 Gruplanmış Seri  Bir seriyi özetlemek ve daha anlaşılır hale getirmek istediğimizde gruplandırılmış seriyi kullanırız. 36 Örnek : Bir mağazada satılan kot pantolonların bedenlerine göre satış adetleri; 28 beden 2 adet 29 beden 5 adet 30 beden 6 adet 32 beden 7 adet 33 beden 1 adet 34 beden 4 adet Frekans, olaydaki tekrar sayısıdır.

37 Gruplanmış Seri Tabloları 37 Basit serilerde şans değişkeni kesikli olduğundan verileri bir tablo şekline getirip frekans dağılımı ve rölatif frekans dağılımını kullanırız. Rölatif (göreli) frekanslar her bir grubun içerisindeki miktarı yüzde olarak ifade eden değerlerdir. Kümülatif frekans ise mevcut grup ve kendinden önceki grupların toplam içindeki yüzdesini ifade eder. Beden Adet(fre.) Relatif(göreli) Frekans Kümülatif Frekans / 25 = 0,080, / 25 = 0,200, / 25 = 0,24 0, / 25 = 0,280, / 25 = 0,040, / 25 = 0,161,00 Toplam 25 1,00

38 Gruplanmış Seri Tabloları 38

39 Gruplanmış Seri Tabloları 39

40 Gruplanmış Seri Tabloları 40

41 Gruplanmış Seri Tabloları 41

42 Bileşik Seri Aylık gelir (dolar) Tasarruf (dolar)  Gözlem değerlerini iki veya daha fazla vasfa göre bir araya getiren serilere bileşik seri" adı verilir. Basit bileşik seri 2 sütundan oluşur. Sütunlardan birinde gözlem değerleri vasıflardan birine göre küçükten büyüğe doğru sıralanır. Diğer sütunda ise her birimin diğer vasfına ilişkin gözlem değeri yer alır Bir işyerinde çalışan 3 işçinin aylık gelir ve tasarruflarını gösteren basit bileşik seri

43 Frekans bölünmesi  Simetrik seri: frekanslar serinin maksimum noktasının etrafında simetrik olarak dağılır.  Bir olaya etki eden faktörler tesadüfi olarak ortaya çıkıyor ve olayı zıt yönde etkiliyorlarsa ve bu etkilerin şiddet dereceleri de birbirine eşitse bu tip seriler ortaya çıkar  Simetrik seri sivri, normal ve basık olabilir.  Normal seride maksimum nokta belli bir yüksekliktedir. Bu yükseklik normalin üstünde ise sivri seriden altında ise basık seriden söz edilir

44 Frekans bölünmesi Eğer gözlem sayısı artarken sınıf aralığı sonsuz küçültülürse, frekans poligonu bir frekans eğrisi şekline dönüşür. Uygulamada sıkça karşılaşılan frekans eğrileri Şekil 2. 5’de gösterilmiştir.

45 Frekans bölünmesi  Frekanslar serinin tam ortasında değil de, ortadan önceki bir noktada yığıldığında "sağa eğik seri" den, ortadan sonraki bir noktada yığıldığında ise "sola eğik seri"den söz edilir. Her iki durumda da seri asirnetrik olup, sağa eğik seriye "asimetrisi pozitif seri", sola eğik seriye "asimetrisi negatif “ seri adı da verilir.  Seriye baktığımızda kuyruk sağımızda kalıyorsa seri sağa eğik solumuzda kalıyorsa sola eğik bir seridir

46 Frekans bölünmesi  Sağa eğik seriye örnek: kamu sektöründe çalışanlara ödenen maaşların bölünmesi. Maaşların çoğu aritmetik ortalamanın altında  Sola eğik seriye örnek: sorular kolay olduğunda sınav sonuçlarının bölünmesi. Notların çoğu aritmetik ortalamanın üstünde.

47 Frekans bölünmesi Çok maksimumlu seri  Frekansların iki yada daha çok maksimum yaptığı seri  Kütle homojen birimleri kapsamadığı zaman ortaya çıkar mesela erkek ve kadın boylarının aynı seride yer alması çift maksimumlu seri ortaya çıkarır.

48 Frekans bölünmesi J serisi  Frekans başta düşük yavaşça artar sonra ani yükselir.  Yaşa göre kalp hastalıklarından ölüm J serisine tipik bir örnektir.

49 Frekans bölünmesi Ters J serisi  Ters J serisinde ise, J serisinin aksine, frekanslar başlarda en yüksek düzeyde olup hemen şiddetle düşer ve azalışı sonra hafiflemekle beraber devam eder.  Büyüklüklerine göre işletmelerin bölünmesi  Çocuk hastalıklarından ölümlerin yaşa göre bölünmesi

50 Frekans bölünmesi U serisi  Bu serilerde maksimum frekanslar serinin iki ucunda, minimum frekanslar ise ortalarda yer alır.  Ölüm oranlarının veya işsizliğin yaşlara göre bölünmesi

51 GRAFİKLER  Grafikler istatistiksel bilgilerin şekillerle ifade edilmesidir.  Grafik gözlem sonuçlarının anlaşılmasını kolaylaştırır.  Çünkü grafik temsil ettiği olayın bileşimini ve değişmelerindeki ana eğilimi bütün canlılığı ile ilk bakışta belli eder.  Bu nedenle, rakamlardan hoşlanmayan veya onlardan anlam çıkarmakta güçlük çeken bir kimse serilerden çok grafiklerle ilgilenir.  Grafiğin bir dezavantajı küçük farkları ve değişmeleri gösterememesidir.  iyi çizilmiş bir grafik üzerinde gösterilen sonuçlar insanlarda sürekli bir izlenim bırakır.

52 GRAFİKLER

53 Aşağıda Amerika’nın 6 şehrindeki işsizlik rakamları ile ilgili veriler verilmiştir Örnek-sütun grafiği

54 Sütun grafiği

55 soru  Bu verilere ait çubuk diyagram grafiğini çiziniz Evde yaşayan kişi sayısı Toplam180

56 GRAFİKLER  Alan diyagramlarının en çok kullanılanı daire şeklinde olanıdır.  Daire grafiği dağılımın nisbi frekansını göstermek bakımından yararlıdır. Daire frekansa göre oransal olarak kısımlara bölünür ve bölümler farklı gruplara tahsis edilir.

57 200 atlete favorisi olan spor ayakkabı markası sorulmuş ve aşağıdaki sonuçlar elde edilmiştir. Alan grafiğini (daire) çiziniz

58 Ayakkabı markaları için daire grafiği

59 Ağırlık Verileri 59

60 Sınıflanmış Seri Tabloları 60 Sınıf Frekans Relatif(göreli) Fre. Küm. Relatif Fre ’den az 3 3 / 50 = 0,06 0, ’den az 5 5 / 50 = 0,10 0, ’den az / 50 = 0,20 0, ’den az / 50 = 0,34 0, ’den az 9 9 / 50 = 0,18 0, ’den az 5 5 / 50 = 0,10 0, ’den az 1 1 / 50 = 0,02 1,00 Toplam 50 1,00


"İSTATİSTİK 1 VERİLERİN DÜZENLENMESİ VE SUNUMU Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK" indir ppt

Benzer bir sunumlar


Google Reklamları