Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK İSTATİSTİK VERİLERİN DÜZENLENMESİ VE SUNUMU Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK tover@sakarya.edu.tr
VERİLERİN DÜZENLENMESİ VE SUNUMU Hangi yöntemle elde edilirse edilsin elimize ulaşan veriler ham veri olarak adlandırılır. Bu verilerin analize uygun hale getirilmeleri için düzenlenmeleri ve sıralanmaları gerekir. Bunlarda bize serileri verir. Toplanan veriler kolay ve anlaşılır bir biçimde düzenlenmelidir. Bu düzenleme çeşitli şekillerde yapılabilir. Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden faydalanılır.
VERİLERİN DÜZENLENMESİ VE SUNUMU Seriler; Zaman serileri Mekan serileri Dağılım serileri Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. Sınıflanmış seri: Sınıflanmış serilerde tekrarlanan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir.
Zaman serisi Verileri gün, hafta, ay, yıl gibi zaman vasfının şıklarına göre düzenlenmiş olarak gösteren serilerdir. Zaman serisi iki sütundan oluşur. Birinci sütunda zaman vasfının şıkları, ikinci sütunda ise olaya ait değerler bulunur. Örnek: Yıllara göre Türkiye nüfusu Yıllar Nüfus(milyon) 1950 20,9 1955 24,1 1960 27,8 1965 31,4 1970 35,6
Mekan serisi Toplanan verileri mekan vasfının şıklarına göre sıralanmış olarak gösteren seriler mekan serileri adını alır. Mekan vasfının şıkları ülke, bölge, il, ilçe, köy gibi şıklar olabilir. Seri iki sütundan oluşur. İlk sütunda mekan vasfının şıkları, ikici sütunda değerler bulunur. Örnek: İllere göre 1970 yılı nüfus değerleri İller Nüfus(bin kişi) İstanbul 3.019 Ankara 2.042 İzmir 1.427 Adana 1.035 Bursa 848
Dağılım serileri Zaman ve mekan vasfının dışında kalan maddi değişken olarak tanınan değişkenlerin şıklarına göre düzenlenmiş seriler dağılım serileridir. Bir sınıftaki öğrencilerin aldığı notlar, boy uzunluğu, ağırlık , işçi sayısı gibi özellikler örnek verilebilir. Dağılım serileri sayısal olmayan özelliklere göre de düzenlenebilir. Ancak sayısal özelliklere göre düzenlenmiş dağılım serileri daha çok kullanılmaktadır. Bu tür dağılım serileri 3 sınıfta toplanabilir. Basit seriler Frekanslı/Sınıflanmış (tasnif edilmiş) seriler Gruplanmış seriler
Sınıflı/Frekanslı seri Dağılım Serileri Basit seri Sınıflı/Frekanslı seri Gruplu seri
Basit Seri Araştırma veya analizlerde kullanılmak üzere elde edilen veri sayısı az ise bu tür veri yapılarına BASİT SERİ adı verilir. Verilerin büyükten küçüğe veya küçükten büyüğe sıralanmasıyla oluşturulan seridir. Örnek: 7 öğrencinin bir dersten devamsızlık sayıları 3,4,6,1,5,2,4 olsun. Verileri küçükten büyüğe doğru sıraladığımızda; basit seri; 1,2,3,4,4,5,6 elde edilir.
Basit Seri Örnek: Bir işletmede çalışan 25 işçiye verilecek çocuk paraları ile ilgili bir araştırma yapılmaktadır. İşçilerin çocuk sayıları aşağıda verilmiştir. 1,3,2,2,3,1,4,5,3,6,0,5,2,3,2,4,8,0,1,2,3,3,1,0,4 Verilen değerleri basit seri şeklinde düzenleyelim. 0,0,0,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,4,4,4,5,5,6,8
Basit Seri
Basit Seri Örnek: 12 öğrencinin bir dersten aldığı notlar; 50, 65, 0, 30, 25, 50, 30, 45, 90, 70, 50, 75 Notlar(xi ) 25 30 45 50 65 70 75 90
VERİLERİN DÜZENLENMESİ VE SUNUMU
VERİLERİN DÜZENLENMESİ VE SUNUMU Basit seride veriler küçükten büyüğe doru sıralanır. 18, 20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 29, 29, 30, 31, 32, 32 Basit seriler bazı küçük düzenlemelerle frekanslı seriye dönüştürülebilir
Frekanslı seri Gözlem sonuçlarının düzenlenerek birinci sütunda olaya ait değerleri, ikinci sütunda frekansları gösterecek şekilde hazırlanırsa sınıflanmış seri elde edilir. Örnek: 12 öğrencinin bir derse ait notları (basit seri için verilen örnek) ve frekansları Notlar(xi) Frekanslar(ni) 1 25 30 2 45 50 3 65 70 75 90 Not; frekans değerlerinin toplamının gözlem sayısına eşit olması gerekir.
Frekanslı Seri Değişkenlerin çeşitli şıklarının kütlede kaç defa tekrarlandığını gösteren sayılar frekans adını alır. İncelenecek birim sayısının artması ile basit seriler yan yana veya alt alta yazılmış uzun sayı dizileri oluşturulacaktır. Bu durumda çalışma kolaylığı sağlaması için frekans serileri düzenlenir. xi fi 3 1 4 2 5 6 8 Toplam 25 Örnek: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz. Basit seri; 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 6, 8
Frekans Serilerinin Grafikle Gösterilmesi
Basit seri 18, 20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 29, 29, 30, 31, 32, 32 Frekanslı seri X (satış adedi) 18 1 20 21 22 23 3 24 4 25 26 5 27 28 29 2 30 31 32 toplam Ele alınan değişkenin şıkları çok sayıda ise sınıflamada sorun çıkabilir. Bu durumda gruplamaya başvurulur.
Gruplamanın bu yararları yanında bazı sakıncaları da vardır. Bir değişkenin birbirine yakın olan şıklarını bir araya getirmeye gruplama denir. Örneğin meslek istatistikleri yapılırken serbest çalışan doktor, avukat, dişçi, tüccar gibi meslekler “serbest meslekler” grubuna alınmaktadır. Gruplama ile toplanan veriler hakkında daha geniş ve açık bilgiler alınabileceği gibi, her gruba düşen frekans sayısı da büyür. Gruplamanın bu yararları yanında bazı sakıncaları da vardır. Örneğin grup sınırlarının belirtilmesi önemli bir sorundur.
Kesikli değişkenlerde gruplu seri Çalışan İşçi Sayısı KOBİ Sayısı 5 – 14 10 15 – 24 20 25 – 34 25 35 – 44 15 45 – 54 5 Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur. Yandaki seride KOBİ’lerde çalışan işçi sayısı değişkeni kesikli bir özelliğe sahiptir. Bu değişken tamsayı dışında değerler almaz. Bu sebeple sınıflar arası boşluklar oluşur. sınıflar 18-20 2 21-23 5 24-26 12 27-29 7 30-32 4 toplam 30 k=5 (32-18)/5=2.8
Gruplanmış seri
Gruplanmış seri Gramaj verileri 1 2 3 5 4 Oluşturulan frekanslı seri Paketlerin gramajları 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 frekanslar 1 2 3 5 4 Oluşturulan frekanslı seri
Gruplanmış seri 1 2 3 5 4 Oluşturulan frekanslı seri Paketlerin gramajları 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 frekanslar 1 2 3 5 4 Oluşturulan frekanslı seri sınıflar 992-994 den az 2 994-996 dan az 5 996-998 den az 4 998-1000 den az 8 1000-1002 den az 1002-1004 den az 1004-1006 dan az 3 toplam 30 Sürekli değişkene ait gruplu seri
sınıf orta noktası: sınıfı iki eşit parçaya bölen nokta sınıf orta noktası: sınıfı iki eşit parçaya bölen nokta. Üst ve alt limitin orta noktasıdır. Sınıf aralığı: üst sınıf limitinin alt sınıf limitinden çıkarılması ile elde edilen değer. Sınıf frekansı: her bir sınıftaki gözlem sayısıdır
Bir işletme fakültesi dekanı öğrencilerin haftalık kaç saat çalıştıklarıyla ilgili bir çalışma yapıyor. 30 öğrenciyi tesadüfi olarak seçiyor ve onların geçen hafta kaç saat çalıştıklarını kaydediyor. 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6. Veriyi sınıflandırıp frekans tablosunu oluşturunuz.
Adım 1: kaç tane sınıf kullanacağına aşağıdaki formülle belirle 2k > n k=sınıf sayısı n=gözlem sayısı
Adım 2: sınıf aralığını (i) aşağıdaki formülü kullanarak bul H – L k 33.8 – 10.3 5 i > = = 4.7 H=verideki en büyük değer, L=verideki en küçük değer, k=sınıf sayısı Çıkan sonucu 5’e yuvarla İlk sınıfın alt sınırını 10 olarak belirle ve 5 sınıf oluştur.
Adım 3: herbir sınıf için limitleri belirle ve frekans dağılımını oluştur
Sınıf orta noktası : aşağıdaki formülü kullanarak sınıf orta noktasını hesapla Ust limit + alt limit 2
Nisbi frekans dağılımı herbir sınıftaki frekansın toplam frekanstaki oranını verir
Örnek: Frekans tablosunu oluşturma Adım 1: sınıf sayısını belirle 2k > n. Formülünü uygula 80 araç satıldığından uygun sınıf sayısı en az 7 olmalı. Adım 2: sınıf aralığını belirle i (H-L)/k formülünü kullandığımızda sınıf aralığı ($35,925 - $15,546)/7 = $2,911 olarak bulunur Bu rakamı yukarıya 10 veya 100’ün katları şeklinde yuvarla
Örnek: Frekans tablosunu oluşturma Adım 3: sınıf sınırlarını oluştur ve frekans tablosunu oluştur
Frekans tablosunu oluştur
Nisbi frekans dağılımı
Bir verinin gruplanmış seriye dönüştürülmesi Xmin: 25 Xmax: 95 Serinin sınıf aralıkları 11 birim olacak şekilde gruplanması uygun olacaktır. Öğrencilerin notları 37 67 79 58 51 33 53 95 60 64 43 66 81 65 50 70 46 59 57 77 25 40 56 89 63 80 73
Bir verinin gruplanmış seriye dönüştürülmesi Notlar Öğrenci sayısı 25 - 37 dan az 2 37 - 49 “ “ 4 49 - 61 “ “ 17 61 - 73 “ “ 7 73 - 85 “ “ 85 - 97 “ “
Gruplanmış Seri Bir seriyi özetlemek ve daha anlaşılır hale getirmek istediğimizde gruplandırılmış seriyi kullanırız. Örnek : Bir mağazada satılan kot pantolonların bedenlerine göre satış adetleri; 28 beden 2 adet 29 beden 5 adet 30 beden 6 adet 32 beden 7 adet 33 beden 1 adet 34 beden 4 adet Frekans, olaydaki tekrar sayısıdır.
Gruplanmış Seri Tabloları Basit serilerde şans değişkeni kesikli olduğundan verileri bir tablo şekline getirip frekans dağılımı ve rölatif frekans dağılımını kullanırız. Rölatif (göreli) frekanslar her bir grubun içerisindeki miktarı yüzde olarak ifade eden değerlerdir. Kümülatif frekans ise mevcut grup ve kendinden önceki grupların toplam içindeki yüzdesini ifade eder. Beden Adet(fre.) Relatif(göreli) Frekans Kümülatif Frekans 28 2 2 / 25 = 0,08 0,08 29 5 5 / 25 = 0,20 0,28 30 6 6 / 25 = 0,24 0,52 32 7 7 / 25 = 0,28 0,80 33 1 1 / 25 = 0,04 0,84 34 4 4 / 25 = 0,16 1,00 Toplam 25 1,00
Gruplanmış Seri Tabloları
Gruplanmış Seri Tabloları
Gruplanmış Seri Tabloları
Gruplanmış Seri Tabloları
Bileşik Seri Gözlem değerlerini iki veya daha fazla vasfa göre bir araya getiren serilere bileşik seri" adı verilir. Basit bileşik seri 2 sütundan oluşur. Sütunlardan birinde gözlem değerleri vasıflardan birine göre küçükten büyüğe doğru sıralanır. Diğer sütunda ise her birimin diğer vasfına ilişkin gözlem değeri yer alır Aylık gelir (dolar) Tasarruf (dolar) 1355 50 1300 40 1200 45 Bir işyerinde çalışan 3 işçinin aylık gelir ve tasarruflarını gösteren basit bileşik seri
Frekans bölünmesi Simetrik seri: frekanslar serinin maksimum noktasının etrafında simetrik olarak dağılır. Bir olaya etki eden faktörler tesadüfi olarak ortaya çıkıyor ve olayı zıt yönde etkiliyorlarsa ve bu etkilerin şiddet dereceleri de birbirine eşitse bu tip seriler ortaya çıkar Simetrik seri sivri, normal ve basık olabilir. Normal seride maksimum nokta belli bir yüksekliktedir. Bu yükseklik normalin üstünde ise sivri seriden altında ise basık seriden söz edilir
Frekans bölünmesi Eğer gözlem sayısı artarken sınıf aralığı sonsuz küçültülürse, frekans poligonu bir frekans eğrisi şekline dönüşür. Uygulamada sıkça karşılaşılan frekans eğrileri Şekil 2. 5’de gösterilmiştir.
Frekans bölünmesi Frekanslar serinin tam ortasında değil de, ortadan önceki bir noktada yığıldığında "sağa eğik seri" den, ortadan sonraki bir noktada yığıldığında ise "sola eğik seri"den söz edilir. Her iki durumda da seri asirnetrik olup, sağa eğik seriye "asimetrisi pozitif seri", sola eğik seriye "asimetrisi negatif “ seri adı da verilir. Seriye baktığımızda kuyruk sağımızda kalıyorsa seri sağa eğik solumuzda kalıyorsa sola eğik bir seridir
Frekans bölünmesi Sağa eğik seriye örnek: kamu sektöründe çalışanlara ödenen maaşların bölünmesi. Maaşların çoğu aritmetik ortalamanın altında Sola eğik seriye örnek: sorular kolay olduğunda sınav sonuçlarının bölünmesi. Notların çoğu aritmetik ortalamanın üstünde.
Frekans bölünmesi Çok maksimumlu seri Frekansların iki yada daha çok maksimum yaptığı seri Kütle homojen birimleri kapsamadığı zaman ortaya çıkar mesela erkek ve kadın boylarının aynı seride yer alması çift maksimumlu seri ortaya çıkarır.
Frekans bölünmesi J serisi Frekans başta düşük yavaşça artar sonra ani yükselir. Yaşa göre kalp hastalıklarından ölüm J serisine tipik bir örnektir.
Frekans bölünmesi Ters J serisi Ters J serisinde ise, J serisinin aksine, frekanslar başlarda en yüksek düzeyde olup hemen şiddetle düşer ve azalışı sonra hafiflemekle beraber devam eder. Büyüklüklerine göre işletmelerin bölünmesi Çocuk hastalıklarından ölümlerin yaşa göre bölünmesi
Frekans bölünmesi U serisi Bu serilerde maksimum frekanslar serinin iki ucunda, minimum frekanslar ise ortalarda yer alır. Ölüm oranlarının veya işsizliğin yaşlara göre bölünmesi
GRAFİKLER Grafikler istatistiksel bilgilerin şekillerle ifade edilmesidir. Grafik gözlem sonuçlarının anlaşılmasını kolaylaştırır. Çünkü grafik temsil ettiği olayın bileşimini ve değişmelerindeki ana eğilimi bütün canlılığı ile ilk bakışta belli eder. Bu nedenle, rakamlardan hoşlanmayan veya onlardan anlam çıkarmakta güçlük çeken bir kimse serilerden çok grafiklerle ilgilenir. Grafiğin bir dezavantajı küçük farkları ve değişmeleri gösterememesidir. iyi çizilmiş bir grafik üzerinde gösterilen sonuçlar insanlarda sürekli bir izlenim bırakır.
GRAFİKLER
Örnek-sütun grafiği Aşağıda Amerika’nın 6 şehrindeki işsizlik rakamları ile ilgili veriler verilmiştir
Sütun grafiği
soru Bu verilere ait çubuk diyagram grafiğini çiziniz Evde yaşayan kişi sayısı 1 6 2 18 3 24 4 41 5 35 15 7 19 8 14 10 Toplam 180
GRAFİKLER Alan diyagramlarının en çok kullanılanı daire şeklinde olanıdır. Daire grafiği dağılımın nisbi frekansını göstermek bakımından yararlıdır. Daire frekansa göre oransal olarak kısımlara bölünür ve bölümler farklı gruplara tahsis edilir.
200 atlete favorisi olan spor ayakkabı markası sorulmuş ve aşağıdaki sonuçlar elde edilmiştir. Alan grafiğini (daire) çiziniz
Ayakkabı markaları için daire grafiği
Ağırlık Verileri
Sınıflanmış Seri Tabloları Sınıf Frekans Relatif(göreli) Fre. Küm. Relatif Fre. 50-57’den az 3 3 / 50 = 0,06 0,06 57-64’den az 5 5 / 50 = 0,10 0,16 64-71’den az 10 10 / 50 = 0,20 0,36 71-78’den az 17 17 / 50 = 0,34 0,70 78-85’den az 9 9 / 50 = 0,18 0,88 85-92’den az 5 5 / 50 = 0,10 0,98 92-99’den az 1 1 / 50 = 0,02 1,00 Toplam 50 1,00