Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

Slides:



Advertisements
Benzer bir sunumlar
MERKEZİ YIĞILMA (EĞİLİM) ÖLÇÜLERİ
Advertisements

Tanımlayıcı İstatistikler
Tanımlayıcı İstatistikler
Veri Toplama, Verilerin Özetlenmesi ve Düzenlenmesi
İstatistikte Bazı Temel Kavramlar
7.SINIF MATEMATİK DERSİ “TABLO VE GRAFİKLER”
Değişkenlik Ölçüleri.
Frekans Dağılımı ve Grafikleme
VERİLERİN DERLENMESİ VE SUNUMU
OLASILIK ve KURAMSAL DAĞILIMLAR
TANIMLAYICI İSTATİSTİKLER
Merkezi Eğilim (Yer) Ölçüleri
Merkezi Eğilim (Yer) Ölçüleri
1 İSTATİSTİK. 2 Kavramlar ve Sayısal Bilginin Özetlenmesi İstatistik nedir? Tanımlar İş Hayatındaki Önemi Sayısal Bilginin Özetlenmesi Anakütle — Örneklem.
Bu slayt, tarafından hazırlanmıştır.
Ölçme Sonuçlarının Değerlendirilmesi
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
DEĞİŞKENLİK ÖLÇÜLERİ.
VERİLERİN TOPLANMASI, DÜZENLENMESİ VE TABLO VE GRAFİKLER YARDIMIYLA SUNUMU İstatistik Doç. Dr. Şakir GÖRMÜŞ SAÜ.
İÇERİK(2.HAFTA) Veri Toplama Hedef Kitlenin Belirlenmesi
İÇERİK TEMEL İSTATİSTİK KAVRAMLARI Birim Vasıf ve Şık Kütle
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri
Sıklık Tabloları ve Tek Değişkenli Grafikler
İSTATİKSEL MERKEZİ EĞİLİM ÖLÇÜLERİ (ORTALAMALAR)
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Sayısal Tanımlayıcı Teknikler
Olasılık Dağılımları ve Kuramsal Dağılışlar
Uygulama 3.
Nicel Analizlere Giriş
Asimetri ve Basıklık Ölçüleri
Analitik olmayan ortalamalar
Bölüm 03 Sayısal Tanımlama Teknikleri
Sayısal Analiz Sayısal İntegral 3. Hafta
Merkezi Eğilim (Yığılma) Ölçüleri
SAYISAL VERİLERİN SINIFLANDIRILMASI
Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
OLASILIK ve İSTATİSTİK BÖLÜM 2 AÇIKLAYICI (BETİMLEYİCİ) İSTATİSTİK Yrd. Doç. Dr. Fatih TOSUNOĞLU.
Istatistik.
1 Sayısal Data’nın Sunumu. 2 Data Sunumu Özet Tablo Nokta Grafik Pasta Grafik Sayısal Data Sunumu Çubuk Grafik Nitel Data Gövde&Yaprak Gösterim Frekans.
ÖLÇME VE DEĞERLENDİRME DERSİ
İstatİstİksel verİlerİ Düzenleme- frekans
Yrd.Doç. Dr. Özcan PALAVAN
ARAŞTIRMA YÖNTEM ve TEKNİKLERİ
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Yrd.Doç. Dr. Özcan PALAVAN
Merkezi Eğilim Ölçüleri
MERKEZİ EĞİLİM(YIĞILMA) ÖLÇÜLERİ
VERİLERİN DERLENMESİ VE SUNUMU
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri
İŞLU İstatistik -Ders 3-.
Merkeze Yayılma Ölçüleri
DEĞİŞKENLİK ÖLÇÜLERİ.
DEĞİŞKENLİK ÖLÇÜLERİ.
Sapma (Dağılma) ölçüleri
Uygulama I.
Tıp Fakültesi UYGULAMA 2
ÖLÇME-DEĞERLENDİRME 8. SINIF
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
İstatistik Ders Notları.
TARIM EKONOMİSİ İSTATİSTİĞİ
NİŞANTAŞI ÜNİVERSİTESİ
Sunum transkripti:

Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK İSTATİSTİK VERİLERİN DÜZENLENMESİ VE SUNUMU Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK tover@sakarya.edu.tr

VERİLERİN DÜZENLENMESİ VE SUNUMU Hangi yöntemle elde edilirse edilsin elimize ulaşan veriler ham veri olarak adlandırılır. Bu verilerin analize uygun hale getirilmeleri için düzenlenmeleri ve sıralanmaları gerekir. Bunlarda bize serileri verir. Toplanan veriler kolay ve anlaşılır bir biçimde düzenlenmelidir. Bu düzenleme çeşitli şekillerde yapılabilir. Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden faydalanılır.

VERİLERİN DÜZENLENMESİ VE SUNUMU Seriler; Zaman serileri Mekan serileri Dağılım serileri Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. Sınıflanmış seri: Sınıflanmış serilerde tekrarlanan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir.

Zaman serisi Verileri gün, hafta, ay, yıl gibi zaman vasfının şıklarına göre düzenlenmiş olarak gösteren serilerdir. Zaman serisi iki sütundan oluşur. Birinci sütunda zaman vasfının şıkları, ikinci sütunda ise olaya ait değerler bulunur. Örnek: Yıllara göre Türkiye nüfusu Yıllar Nüfus(milyon) 1950 20,9 1955 24,1 1960 27,8 1965 31,4 1970 35,6

Mekan serisi Toplanan verileri mekan vasfının şıklarına göre sıralanmış olarak gösteren seriler mekan serileri adını alır. Mekan vasfının şıkları ülke, bölge, il, ilçe, köy gibi şıklar olabilir. Seri iki sütundan oluşur. İlk sütunda mekan vasfının şıkları, ikici sütunda değerler bulunur. Örnek: İllere göre 1970 yılı nüfus değerleri İller Nüfus(bin kişi) İstanbul 3.019 Ankara 2.042 İzmir 1.427 Adana 1.035 Bursa 848

Dağılım serileri  Zaman ve mekan vasfının dışında kalan maddi değişken olarak tanınan değişkenlerin şıklarına göre düzenlenmiş seriler dağılım serileridir. Bir sınıftaki öğrencilerin aldığı notlar, boy uzunluğu, ağırlık , işçi sayısı gibi özellikler örnek verilebilir. Dağılım serileri sayısal olmayan özelliklere göre de düzenlenebilir. Ancak sayısal özelliklere göre düzenlenmiş dağılım serileri daha çok kullanılmaktadır.  Bu tür dağılım serileri 3 sınıfta toplanabilir. Basit seriler Frekanslı/Sınıflanmış (tasnif edilmiş) seriler Gruplanmış seriler

Sınıflı/Frekanslı seri Dağılım Serileri Basit seri Sınıflı/Frekanslı seri Gruplu seri

Basit Seri Araştırma veya analizlerde kullanılmak üzere elde edilen veri sayısı az ise bu tür veri yapılarına BASİT SERİ adı verilir. Verilerin büyükten küçüğe veya küçükten büyüğe sıralanmasıyla oluşturulan seridir. Örnek: 7 öğrencinin bir dersten devamsızlık sayıları 3,4,6,1,5,2,4 olsun. Verileri küçükten büyüğe doğru sıraladığımızda; basit seri; 1,2,3,4,4,5,6 elde edilir.

Basit Seri Örnek: Bir işletmede çalışan 25 işçiye verilecek çocuk paraları ile ilgili bir araştırma yapılmaktadır. İşçilerin çocuk sayıları aşağıda verilmiştir. 1,3,2,2,3,1,4,5,3,6,0,5,2,3,2,4,8,0,1,2,3,3,1,0,4 Verilen değerleri basit seri şeklinde düzenleyelim. 0,0,0,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,4,4,4,5,5,6,8

Basit Seri

Basit Seri Örnek: 12 öğrencinin bir dersten aldığı notlar; 50, 65, 0, 30, 25, 50, 30, 45, 90, 70, 50, 75   Notlar(xi ) 25 30 45 50 65 70 75 90

VERİLERİN DÜZENLENMESİ VE SUNUMU

VERİLERİN DÜZENLENMESİ VE SUNUMU Basit seride veriler küçükten büyüğe doru sıralanır. 18, 20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 29, 29, 30, 31, 32, 32 Basit seriler bazı küçük düzenlemelerle frekanslı seriye dönüştürülebilir

Frekanslı seri   Gözlem sonuçlarının düzenlenerek birinci sütunda olaya ait değerleri, ikinci sütunda frekansları  gösterecek şekilde  hazırlanırsa sınıflanmış seri elde edilir. Örnek: 12 öğrencinin bir derse ait notları (basit seri için verilen örnek) ve frekansları Notlar(xi) Frekanslar(ni) 1 25 30 2 45 50 3 65 70 75 90 Not; frekans değerlerinin toplamının gözlem sayısına eşit olması gerekir.

Frekanslı Seri Değişkenlerin çeşitli şıklarının kütlede kaç defa tekrarlandığını gösteren sayılar frekans adını alır. İncelenecek birim sayısının artması ile basit seriler yan yana veya alt alta yazılmış uzun sayı dizileri oluşturulacaktır. Bu durumda çalışma kolaylığı sağlaması için frekans serileri düzenlenir. xi fi 3 1 4 2 5 6 8 Toplam 25 Örnek: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz. Basit seri; 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 6, 8

Frekans Serilerinin Grafikle Gösterilmesi

Basit seri 18, 20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 29, 29, 30, 31, 32, 32 Frekanslı seri X (satış adedi) 18 1 20 21 22 23 3 24 4 25 26 5 27 28 29 2 30 31 32 toplam Ele alınan değişkenin şıkları çok sayıda ise sınıflamada sorun çıkabilir. Bu durumda gruplamaya başvurulur.

Gruplamanın bu yararları yanında bazı sakıncaları da vardır.   Bir değişkenin birbirine yakın olan şıklarını bir araya getirmeye gruplama denir. Örneğin meslek istatistikleri yapılırken serbest çalışan doktor, avukat, dişçi, tüccar gibi meslekler “serbest meslekler”  grubuna alınmaktadır. Gruplama ile toplanan veriler  hakkında daha geniş ve açık bilgiler alınabileceği gibi, her gruba düşen frekans sayısı da büyür. Gruplamanın bu yararları yanında bazı sakıncaları da vardır. Örneğin grup sınırlarının belirtilmesi önemli bir sorundur.

Kesikli değişkenlerde gruplu seri Çalışan İşçi Sayısı KOBİ Sayısı 5 – 14 10 15 – 24 20 25 – 34 25 35 – 44 15 45 – 54 5 Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur. Yandaki seride KOBİ’lerde çalışan işçi sayısı değişkeni kesikli bir özelliğe sahiptir. Bu değişken tamsayı dışında değerler almaz. Bu sebeple sınıflar arası boşluklar oluşur. sınıflar 18-20 2 21-23 5 24-26 12 27-29 7 30-32 4 toplam 30   k=5 (32-18)/5=2.8  

Gruplanmış seri

Gruplanmış seri Gramaj verileri 1 2 3 5 4 Oluşturulan frekanslı seri Paketlerin gramajları 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 frekanslar 1 2 3 5 4 Oluşturulan frekanslı seri

Gruplanmış seri 1 2 3 5 4 Oluşturulan frekanslı seri Paketlerin gramajları 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 frekanslar 1 2 3 5 4 Oluşturulan frekanslı seri sınıflar 992-994 den az 2 994-996 dan az 5 996-998 den az 4 998-1000 den az 8 1000-1002 den az 1002-1004 den az 1004-1006 dan az 3 toplam 30 Sürekli değişkene ait gruplu seri

sınıf orta noktası: sınıfı iki eşit parçaya bölen nokta sınıf orta noktası: sınıfı iki eşit parçaya bölen nokta. Üst ve alt limitin orta noktasıdır. Sınıf aralığı: üst sınıf limitinin alt sınıf limitinden çıkarılması ile elde edilen değer. Sınıf frekansı: her bir sınıftaki gözlem sayısıdır

Bir işletme fakültesi dekanı öğrencilerin haftalık kaç saat çalıştıklarıyla ilgili bir çalışma yapıyor. 30 öğrenciyi tesadüfi olarak seçiyor ve onların geçen hafta kaç saat çalıştıklarını kaydediyor. 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6. Veriyi sınıflandırıp frekans tablosunu oluşturunuz.

Adım 1: kaç tane sınıf kullanacağına aşağıdaki formülle belirle 2k > n k=sınıf sayısı n=gözlem sayısı  

Adım 2: sınıf aralığını (i) aşağıdaki formülü kullanarak bul H – L k 33.8 – 10.3 5 i > = = 4.7 H=verideki en büyük değer, L=verideki en küçük değer, k=sınıf sayısı Çıkan sonucu 5’e yuvarla İlk sınıfın alt sınırını 10 olarak belirle ve 5 sınıf oluştur.

Adım 3: herbir sınıf için limitleri belirle ve frekans dağılımını oluştur

Sınıf orta noktası : aşağıdaki formülü kullanarak sınıf orta noktasını hesapla Ust limit + alt limit 2

Nisbi frekans dağılımı herbir sınıftaki frekansın toplam frekanstaki oranını verir

Örnek: Frekans tablosunu oluşturma Adım 1: sınıf sayısını belirle 2k > n. Formülünü uygula 80 araç satıldığından uygun sınıf sayısı en az 7 olmalı. Adım 2: sınıf aralığını belirle i  (H-L)/k formülünü kullandığımızda sınıf aralığı ($35,925 - $15,546)/7 = $2,911 olarak bulunur Bu rakamı yukarıya 10 veya 100’ün katları şeklinde yuvarla

Örnek: Frekans tablosunu oluşturma Adım 3: sınıf sınırlarını oluştur ve frekans tablosunu oluştur

Frekans tablosunu oluştur

Nisbi frekans dağılımı

Bir verinin gruplanmış seriye dönüştürülmesi Xmin: 25 Xmax: 95 Serinin sınıf aralıkları 11 birim olacak şekilde gruplanması uygun olacaktır. Öğrencilerin notları 37 67 79 58 51 33 53 95 60 64 43 66 81 65 50 70 46 59 57 77 25 40 56 89 63 80 73

Bir verinin gruplanmış seriye dönüştürülmesi Notlar Öğrenci sayısı 25 - 37 dan az 2 37 - 49 “ “ 4 49 - 61 “ “ 17 61 - 73 “ “ 7 73 - 85 “ “ 85 - 97 “ “

Gruplanmış Seri Bir seriyi özetlemek ve daha anlaşılır hale getirmek istediğimizde gruplandırılmış seriyi kullanırız. Örnek : Bir mağazada satılan kot pantolonların bedenlerine göre satış adetleri; 28 beden 2 adet 29 beden 5 adet 30 beden 6 adet 32 beden 7 adet 33 beden 1 adet 34 beden 4 adet Frekans, olaydaki tekrar sayısıdır.

Gruplanmış Seri Tabloları Basit serilerde şans değişkeni kesikli olduğundan verileri bir tablo şekline getirip frekans dağılımı ve rölatif frekans dağılımını kullanırız. Rölatif (göreli) frekanslar her bir grubun içerisindeki miktarı yüzde olarak ifade eden değerlerdir. Kümülatif frekans ise mevcut grup ve kendinden önceki grupların toplam içindeki yüzdesini ifade eder. Beden Adet(fre.) Relatif(göreli) Frekans Kümülatif Frekans 28 2 2 / 25 = 0,08 0,08 29 5 5 / 25 = 0,20 0,28 30 6 6 / 25 = 0,24 0,52 32 7 7 / 25 = 0,28 0,80 33 1 1 / 25 = 0,04 0,84 34 4 4 / 25 = 0,16 1,00 Toplam 25 1,00

Gruplanmış Seri Tabloları

Gruplanmış Seri Tabloları

Gruplanmış Seri Tabloları

Gruplanmış Seri Tabloları

Bileşik Seri Gözlem değerlerini iki veya daha fazla vasfa göre bir araya getiren serilere bileşik seri" adı verilir. Basit bileşik seri 2 sütundan oluşur. Sütunlardan birinde gözlem değerleri vasıflardan birine göre küçükten büyüğe doğru sıralanır. Diğer sütunda ise her birimin diğer vasfına ilişkin gözlem değeri yer alır Aylık gelir (dolar) Tasarruf (dolar) 1355 50 1300 40 1200 45 Bir işyerinde çalışan 3 işçinin aylık gelir ve tasarruflarını gösteren basit bileşik seri

Frekans bölünmesi Simetrik seri: frekanslar serinin maksimum noktasının etrafında simetrik olarak dağılır. Bir olaya etki eden faktörler tesadüfi olarak ortaya çıkıyor ve olayı zıt yönde etkiliyorlarsa ve bu etkilerin şiddet dereceleri de birbirine eşitse bu tip seriler ortaya çıkar Simetrik seri sivri, normal ve basık olabilir. Normal seride maksimum nokta belli bir yüksekliktedir. Bu yükseklik normalin üstünde ise sivri seriden altında ise basık seriden söz edilir

Frekans bölünmesi Eğer gözlem sayısı artarken sınıf aralığı sonsuz küçültülürse, frekans poligonu bir frekans eğrisi şekline dönüşür. Uygulamada sıkça karşılaşılan frekans eğrileri Şekil 2. 5’de gösterilmiştir.

Frekans bölünmesi Frekanslar serinin tam ortasında değil de, ortadan önceki bir noktada yığıldığında "sağa eğik seri" den, ortadan sonraki bir noktada yığıldığında ise "sola eğik seri"den söz edilir. Her iki durumda da seri asirnetrik olup, sağa eğik seriye "asimetrisi pozitif seri", sola eğik seriye "asimetrisi negatif “ seri adı da verilir. Seriye baktığımızda kuyruk sağımızda kalıyorsa seri sağa eğik solumuzda kalıyorsa sola eğik bir seridir

Frekans bölünmesi Sağa eğik seriye örnek: kamu sektöründe çalışanlara ödenen maaşların bölünmesi. Maaşların çoğu aritmetik ortalamanın altında Sola eğik seriye örnek: sorular kolay olduğunda sınav sonuçlarının bölünmesi. Notların çoğu aritmetik ortalamanın üstünde.

Frekans bölünmesi Çok maksimumlu seri Frekansların iki yada daha çok maksimum yaptığı seri Kütle homojen birimleri kapsamadığı zaman ortaya çıkar mesela erkek ve kadın boylarının aynı seride yer alması çift maksimumlu seri ortaya çıkarır.

Frekans bölünmesi J serisi Frekans başta düşük yavaşça artar sonra ani yükselir. Yaşa göre kalp hastalıklarından ölüm J serisine tipik bir örnektir.

Frekans bölünmesi Ters J serisi Ters J serisinde ise, J serisinin aksine, frekanslar başlarda en yüksek düzeyde olup hemen şiddetle düşer ve azalışı sonra hafiflemekle beraber devam eder. Büyüklüklerine göre işletmelerin bölünmesi Çocuk hastalıklarından ölümlerin yaşa göre bölünmesi

Frekans bölünmesi U serisi Bu serilerde maksimum frekanslar serinin iki ucunda, minimum frekanslar ise ortalarda yer alır. Ölüm oranlarının veya işsizliğin yaşlara göre bölünmesi

GRAFİKLER Grafikler istatistiksel bilgilerin şekillerle ifade edilmesidir. Grafik gözlem sonuçlarının anlaşılmasını kolaylaştırır. Çünkü grafik temsil ettiği olayın bileşimini ve değişmelerindeki ana eğilimi bütün canlılığı ile ilk bakışta belli eder. Bu nedenle, rakamlardan hoşlanmayan veya onlardan anlam çıkarmakta güçlük çeken bir kimse serilerden çok grafiklerle ilgilenir. Grafiğin bir dezavantajı küçük farkları ve değişmeleri gösterememesidir. iyi çizilmiş bir grafik üzerinde gösterilen sonuçlar insanlarda sürekli bir izlenim bırakır.

GRAFİKLER

Örnek-sütun grafiği Aşağıda Amerika’nın 6 şehrindeki işsizlik rakamları ile ilgili veriler verilmiştir

Sütun grafiği

soru Bu verilere ait çubuk diyagram grafiğini çiziniz Evde yaşayan kişi sayısı 1 6 2 18 3 24 4 41 5 35 15 7 19 8 14 10 Toplam 180

GRAFİKLER Alan diyagramlarının en çok kullanılanı daire şeklinde olanıdır. Daire grafiği dağılımın nisbi frekansını göstermek bakımından yararlıdır. Daire frekansa göre oransal olarak kısımlara bölünür ve bölümler farklı gruplara tahsis edilir.

200 atlete favorisi olan spor ayakkabı markası sorulmuş ve aşağıdaki sonuçlar elde edilmiştir. Alan grafiğini (daire) çiziniz

Ayakkabı markaları için daire grafiği

Ağırlık Verileri

Sınıflanmış Seri Tabloları Sınıf Frekans Relatif(göreli) Fre. Küm. Relatif Fre. 50-57’den az 3 3 / 50 = 0,06 0,06 57-64’den az 5 5 / 50 = 0,10 0,16 64-71’den az 10 10 / 50 = 0,20 0,36 71-78’den az 17 17 / 50 = 0,34 0,70 78-85’den az 9 9 / 50 = 0,18 0,88 85-92’den az 5 5 / 50 = 0,10 0,98 92-99’den az 1 1 / 50 = 0,02 1,00 Toplam 50 1,00