27.04.2017 İSTATİSTİK I Doç. Dr. Selami ÖZCAN.

Slides:



Advertisements
Benzer bir sunumlar
İstatistik Tahmin ve Güven aralıkları
Advertisements

Tanımlayıcı İstatistikler
Tanımlayıcı İstatistikler
İstatistikte Temel Kavramlar
Tıp alanında kullanılan temel istatistiksel kavramlar
İstatistik Temel Kavramlarına Giriş
Merkezi Eğilim (Yığılma) Ölçüleri
İstatistikte Bazı Temel Kavramlar
Temel İstatistik Terimler
Değişkenlik Ölçüleri.
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
Ölçme sonuçları üzerinde yapılan istatiksel işlemler
TANIMLAYICI İSTATİSTİKLER
Merkezi Eğilim (Yer) Ölçüleri
Merkezi Eğilim (Yer) Ölçüleri
Ölçme Sonuçlarının Değerlendirilmesi
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
DEĞİŞKENLİK ÖLÇÜLERİ.
SÜREKLİ ŞANS DEĞİŞKENLERİ
Uygulama I.
İSTATİKSEL KAVRAMLAR İstatistik Doç. Dr. Şakir GÖRMÜŞ SAÜ| e-FEK.
İÇERİK(2.HAFTA) Veri Toplama Hedef Kitlenin Belirlenmesi
İÇERİK TEMEL İSTATİSTİK KAVRAMLARI Birim Vasıf ve Şık Kütle
Asimetri ve Basıklık Ölçüleri
NEDEN İSTATİSTİK? 1.
Merkezi Eğilim Ölçüleri (Ortalamalar)
Sıklık Tabloları ve Tek Değişkenli Grafikler
İSTATİKSEL MERKEZİ EĞİLİM ÖLÇÜLERİ (ORTALAMALAR)
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
ÖĞRENME AMAÇLARI Veri analizi kavramı ve sağladığı işlevleri hakkında bilgi edinmek Pazarlama araştırmalarında kullanılan istatistiksel analizlerin.
Uygulama 3.
Nicel Analizlere Giriş
Asimetri ve Basıklık Ölçüleri
İSTATİSTİK YGULAMALARI: SINAVA HAZIRLIK
Analitik olmayan ortalamalar
Bölüm 03 Sayısal Tanımlama Teknikleri
Merkezi Eğilim (Yığılma) Ölçüleri
Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
Rastgele Değişkenlerin Dağılımları
OLASILIK ve İSTATİSTİK
Istatistik.
ÖLÇME VE DEĞERLENDİRME DERSİ
Ölçme ve Değerlendirme
Yrd.Doç. Dr. Özcan PALAVAN
ARAŞTIRMA YÖNTEM ve TEKNİKLERİ
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Merkezi Eğilim Ölçüleri
MERKEZİ EĞİLİM(YIĞILMA) ÖLÇÜLERİ
VERİLERİN DERLENMESİ VE SUNUMU
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri
DEĞİŞİM ÖLÇÜLERİ.
Merkeze Yayılma Ölçüleri
DEĞİŞKENLİK ÖLÇÜLERİ.
Temel İstatistik Terimler
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
DEĞİŞKENLİK ÖLÇÜLERİ.
Sapma (Dağılma) ölçüleri
Tıp Fakültesi UYGULAMA 2
ÖLÇME-DEĞERLENDİRME 8. SINIF
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
İstatistik Ders Notları.
Temel İstatistik Terimler
Sunum transkripti:

27.04.2017 İSTATİSTİK I Doç. Dr. Selami ÖZCAN

Selami ÖZCAN İstatistik BİRİNCİ BÖLÜM İSTATİSTİKLE İLGİLİ TEMEL KAVRAMLAR 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 1. Bölüm: Sunum Planı İstatistiğin Doğuşu, Gelişimi İstatistik nedir? Ve kaça ayrılır? Anakütle ve örnek; istatistik ve parametre nedir? İstatistiksel örnekleme yöntemleri kaça ayrılır? Değişken nedir ve kaça ayrılır? Veri toplama yöntemleri Veri Derleme:Verilerin düzenlenmesi Ölçme nedir? Kaç çeşit ölçek vardır? 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik İstatistiğin Doğuşu İstatistik başlangıçta teknik bir disiplin olarak ele alınırken günümüzde bir bilim dalı olarak kendini kabul ettirmiş, ulusal ve uluslararası boyutta gelişmelerin temelini oluşturmuştur. Son 30 yıla damgasını vuran ve çağımızda bilgi çağı olarak adlandırılan gelişmeler istatistiği evrensel bir konuşma dili haline getirmiştir. Günümüzde ulusal ve uluslararası sosyal ve ekonomik gelişme hedeflerinin belirlenmesi ve bu hedeflerin başarısı güncel, güvenilir istatistiklerle sağlanmaktadır. Doğru bilgi, doğru yorum ve doğru karar sürecinde araştırmacılar, politikacılar, karar alıcılar ve tüm bireyler çalışmalarında istatistiki bilgileri etkin olarak kullanmaktadırlar. İlk çağda bile insanlar bazı toplu olayları belirleme ihtiyacı duymuşlardır. Devletlerin kurulması ile birlikte insanlar sınır belirleme, vergi toplama, toprak dağılımına yönelik amaçlarla ayrıca dil, din farkı olan toplulukların nüfus büyüklüğünü belirleme, askere alma amaçlı bilgiler toplamaya ve bunların kayıtlarını tutmaya başlamışlardır. Orta çağda devletler güçlerini yitirmiş, istatistik konusu gerilemiş ve kent düzeyinde bazı bilgilerin toplandığı değerlendirmelerle sınırlı kalmıştır. Devletlerin güçlenmesi ile birlikte istatistik uygulamaları gelişmiş ve nüfus sayımları yanında; dış ticaret, milli gelir hesabına yönelik fiyat, ücret vb. temel verilerin toplanmasına başlanmıştır. İstatistik metodolojisine yönelik çalışmalar 17. yüzyılda Alman Üniversitesinde "Devletlerin Durumu" adlı bir derste bilimsel olarak gündeme gelmiştir. Derste ülkelerin tarihi, mali, askeri yönetim örgütleri, nüfusları sayılarla ifade edilerek ele alınmış ve bu konu sonradan istatistik olarak adlandırılmıştır. Aynı dönemde sigorta matematikçileri nüfus konusu ile ilgilenmeye başlamışlardır. 27.04.2017 Selami ÖZCAN İstatistik

İstatistiğin Gelişimi 17. yüzyılda Pascal, Bernouilli, Moivne, Laplace, Poisson ve Gauss tarafından yapılan çalışmalar ile ihtimal teorisi, talih oyunları ve tesadüfi olayların çan eğrisi şeklinde dağılım gösterdiği belirlenmiştir. Aynı yüzyılda Belçikalı matematikçi ve astronom Quatelet istatistik sorunlarına eğilmiş, çeşitli eserler yazmıştır. İstatistik Genel Müdürü olan Quatelet istatistiğin kullanım alanını genişleterek kültür, ahlak, doğal olaylar ve özellikle antropometriye yönelik bilgileri değerlendirmiştir. Orta Asya da büyük uygarlıklar kuran Türk toplumları Hindistan'da, Çin'de, İran'da bilgiye önem vermişler, İlhanlılar ve Selçuklular nüfus sayımı çalışmaları yapmışlardır. İstatistikleri tarihi perspektifte değerlendirmek, geçmişi daha iyi anlamak, günümüzü en etkin yapıda kavramak ve geleceğimizi en iyi şekilde planlamamız açısından da çok büyük önem taşımaktadır 17. Yüzyıla kadar sadece bilgi kaydetme şeklinde gerçekleşen istatistiki çalışmalar, 18. ve 19. Yüzyıllarda J. Bernoulli (1645-1705) ve K.Gauss'un (1777-1855) katkılarıyla matematik temelleri üzerine oturtulmuş, ihtimal teorisi geliştirilmiştir. Sosyal ve antropolojik olaylara istatistiği kapsamlı bir şekilde uygulayan ilk matematikçi olan Adolphe Quételet (1796-1874) ise modern istatistiğin kurucusu olarak kabul edilmiştir. 20. Yüzyılın başında R. A. Fisher, K. Pearson ve W. S. Gosset'in katkılarıyla tahmin yapma ve karar verme konuları ön plana çıkarak istatistik artık sayısal verilerin yorum ve değerlendirmesini yapan bir bilimsel metodlar topluluğu haline gelmiştir. 27.04.2017 Selami ÖZCAN İstatistik

İSTATİSTİK BİLİMİ NEDİR? İstatistik kelimesi ilk olarak Almanya’da devlet anlamına gelen status kelimesine dayanılarak kullanılmaya başlanmıştır. Günlük dilde istatistik veya istatistikler; belirli bir olaya ilişkin derlenmiş sayısal bilgiler demektir.İthalat, ihracat, turizm ve inşaat vb. istatistikler bazen sayı ve rakam karşılığında da istatistik kullanılır İstatistik sözcüğü, ele alınan olayların gözlemlenerek ilgili verilerin derlenmesi, işlenmesi, analizi ve yorumlanmasında kullanılan tekniklerin tümünü ifade eder. Dar manada İstatistik: geçmiş ve şimdiki durumla ilgili toplanmış sayısal verileri, geliştirilmiş olan bazı tekniklerle analiz ederek gelecek hakkında karar vermemizi kolaylaştıran bir bilim dalıdır. Geniş Manada İstatistik: belirli amaçlar için verilerin toplanması, düzenlenmesi, uygun yöntemlerle analiz edilmesine denir. Bu analizler vasıtasıyla elde edilen sonuçların YORUMLANMASI ve Bir KARARA bağlanması istatistikle ilgilidir. İSTATİSTİK: Belirlenen amaç/lar doğrultusunda gözlenen yığın olaylardan derlenen sayısal verilerin işlenerek , ilgili olayların oluşturduğu yığınların bilimsel olarak incelenmesinde kullanılan teknik ve yöntemler bilimidir. Rakamlar yalan söylemez, yalancılar rakam söyler. Rakamsal Bilgileri Anlamlandırmak , Belirsizlik ile İlgilenmek, İlişkileri analiz etmek Tahmin , Belirsiz Ortamda Karar Verme Üç türlü yalan vardır. Yalan, kuyruklu yalan, İstatistiki yalan 27.04.2017 Selami ÖZCAN İstatistik

(konuları açısından) İstatistik ikiye ayrılır Deskriptif (tasvir edici-tanımlayıcı) istatistik genel dağılımı ortaya çıkarma, durumu olduğu gibi tasvir etme, kollektif olayların eğilimini araştırır, verilerin özetlenmesi ve tasvir edilmesi ile ilgilidir. Frekans dağılımları Merkezi Eğilim (Yer) ölçüleri Parametrik MEÖ Aritmetik ortalama Geometrik ortalama Harmonik ortalama Kareli ortalama Parametrik olmayan MEÖ Mod Medyan kantiller Dağılım ölçüleri Parametrik dağılım ölçüleri Ortalama sapma Standart sapma Standart hata Varyans Parametrik olmayan dağılım Ölçüleri Değişim aralığı Kartil aralığı Desil aralığı Çarpıklık ve Basıklık İhtimal (toplama, çarpma) İhtimal dağılımları Kesikli ihtimal dağılıları Binom dağılımı Poisson dağılımı Hipergeometrik dağılım Sürekli ihtimal dağılımları Normal dağılım Standart normal dağılım Normalin Binoma yaklaşım 2. İndaktif (tahlil edici-çıkarımcı) istatistik Çıkarımlar mutlak doğru olmadığı için ihtimal kelimesi ile ifade edilir, ileri seviye istatistik bilgisi gerektirir, tümevarım yöntemi kullanılır. Hipotez testlerini içerir. Örnekleme teorisi Ortalama Oranlama Tahmin teorisi (güven sınırları) Oran Hipotez testleri Tek yönlü Çift yönlü Varyans Analizi Regresyon analizi Basit Çoklu Zaman serileri Korelasyon Non parametrik testler İndeksler Kalite Kontrol 27.04.2017 Selami ÖZCAN İstatistik

Tipik Olay ve Yığın Olay İstatistik ve Parametre Yığın Olay: bir olaylar kümesinde tek bir olay kümedeki diğerlerini veya ait olduğu kümeyi tam olarak temsil edemeyen olaylardır. İstatistik yığın olaylarla ilgilenir. Trafik kazaları, evlenmeler, boşanmalar, doğum ve ölüm oranları, yıllık satışlar, ciro vb. Tipik Olay: bir olaylar kümesinde tek bir olayın tüm olaylar kümesini temsil ettiği olaylara denir. Laboratuarda suyun elde edilmesi, Parametre: ana kütledeki bütün birimler üzerinden hesaplanan ölçülere denir. İstatistik: ana kütleyi temsil etme gücüne sahip bir örnekteki verilerden hesaplanan ölçülere denir. 27.04.2017 Selami ÖZCAN İstatistik

Birim (Örnek), birim türleri 1. Birim (Örnek/örneklem): yığın olay niteliğindeki her olaya denir. Ana kütleden tesadüfi yöntemlerle seçilerek oluşturulan yeni oluşuma denir. Birim olması için bir nesne/olayın ölçülmesi veya sayılması yeterlidir. Mesela elle tutulamayan ve gözle görülemeyen, ölçülemeyen ve sayı ile ifade edilemeyen soyut (sevinç, korku, aşk, üzüntü, melek gibi) olaylar birim oluşturmaz. Fakat doğum, ölüm, trafik kazası, insan, hayvan, bina gibi sayılabilen ve ölçülebilen canlı ve cansız varlıklar ile olaylar, sayılarla ifade edildiği için birim oluşturlar. Birim (örnek) Türleri: 1. Maddi birim ve Gayri maddi birim: okul, insan, buzdolabı, araçlar (uzunluk, genişlik ve yükseklik) gibi bir boyuta/varlığa sahip olan, elle tutulup gözle görülebilen somut varlıklar (insan, araba)-Maddesel varlığı (boyutları) olmayan fakat gerçekte olan birimlerdir. Mesela Boşanma, evlenme, doğum, ölüm, trafik kazası gibi 2. Sürekli birim ve Ani birim: belirli bir zaman aralığı (herhangi bir anı) içinde gözlemlenen birimler sürekli: (insan, ticari kuruluş, konut, araçlar sürekli birimlerdir ) bir olay bir fiil biçiminde çıkan oldukça kısa süren(zaman içine dağılmış) birimler ani: Belirli bir anda çıkan ve ancak ortaya çıktıkları anda incelenebilen, maddesel varlığa sahip olmayan birimlerdir. Evlenme, boşanma, trafik kazası, ölüm ani birimlerdir 3. Doğal birim ve Yapay birim: bir bütün oluşturan, parçalanmaları/birleştirilmeleri halinde özelliklerini kaybeden birimlere doğal: (tek parça olarak incelenen olaylar, Örneğin masa, araba, insan, kalem doğal birimlerdir), bir bütün olma özelliği göstermeyen fakat nitelikleri değişmeyen birimlere yapay birim denir. (arsanın parçalara ayrılması, kumaş parçalara ayrılırsa özelliğini kaybetmez ) 4. Gerçek birim ve Gerçek farz edilen (varsayılan) birim: maddesel olarak veya fiil biçiminde var olan birimler gerçek, ortaya çıkmış olması yeterli: Ev, araba, bina, masa maddesel varlığa sahip gerçekte var olan birimleri oluştururken, ölüm, evlenme, doğum, trafik kazası gibi maddesel bir varlığa sahip olmayan ama gerçekte var olan birimler gerçek birimleri oluşturur, gerçekte olmayan varsayılarak oluşturulan birimler. 10 öğrenciden 3 lü grup oluşturmak gibi 27.04.2017 Selami ÖZCAN İstatistik

2. Ana kütle, Ana kütle türleri 2. Ana kütle (istatistik kütlesi): yığın olay niteliğindeki aynı cins birimlerin oluşturduğu topluluğa denir. Veya bir istatistiki araştırmada araştırmaya konu olan bütün birimler aynı nedenlerin etkisinde olması gerekir. Anakütle, istatistik birimleri toplamından farklı bir yapıya sahip olmamalıdır. Üniversite öğrenci ve hoca toplamından farklı bir tüzel kişiliğe sahiptir. Ana kütle türleri: 1. Gerçek anakütle, farazi (varsayılan) anakütle, gerçek birimlerin oluşturduğu anakütle, henüz oluşmamış fakat oluşturulması mümkün olan anakütle varsayılandır. 30 kişilik bir sınıfta rastgele seçilecek 5 kişilik bir grup c(30:5)=142.4 farklı şekilde olur. 2. Sonlu veya Sonsuz anakütle: sayılabiliyorsa sonlu, sayılamıyorsa sonsuz, Türkiye’de yaşayan kişiler sonlu, Marmara’daki canlı sayısı sonsuz. 3. Sürekli veya Kesikli anakütle: parçalandıklarında ve birleştirildiklerinde özelliğini kaybediyorsa kesikli(doğal birimlerden oluşur), kaybetmiyorsa sürekli anakütle(zaman ve mekan birimleri doğal değildir.) Mesela: bir üniversite öğrencileri üzerinde bir araştırma yapılacaksa Üniversitenin bütün öğrencileri ANAKÜTLE, bu öğrenciler arasından seçilen 100 kişilik şans grubuna ÖRNEK denir. Şayet araştırma İİBF bütün öğrencilerine yönelik bir araştırma yapılıyorsa okulun toplam öğrenci sayısı ana kütleyi oluşturur, içinden tesadüfi olarak seçilen 30 öğrenci örnek kütleyi oluşturur. Not: bir istatistiksel araştırma planlanırken araştırmanın nerede yapılacağı, kimlerle/kimler tarafından yapılacağı, ne kadar zamanda yapılacağı, araştırma için ayrılan kaynaklar, toplanacak veriler çok önemlidir. 27.04.2017 Selami ÖZCAN İstatistik

VERİ DERLEME (düzenleme) VERİ DERLEME: belirlenen amaçlar doğrultusunda gözlemlenecek birimlerin ölçülmesi, sayılması sonra da bunların ilgilenilen değişkenlere göre hangi şıklara sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içerir. A. Birim Seçimi: belirlenen amaç/lar doğrultusunda ilgilenilen yığın olayın tanımlanmasıyla seçme işlemi gerçekleşir yani ilk önce kimlerin veya nelerin gözleneceği belirlenir. B. Değişken ve Şıkların Belirlenmesi Değişkenin Belirlenmesi: Veri derlenirken sadece belirlenen amaçlar doğrultusunda değişkenler göz önünde tutulur. Ayrıntı sorunlara neden olabilir. Gözlem sayısı sonlu bir sayı olmalıdır. Şıkların Belirlenmesi: şık, belirli bir özelliğin ortaya çıkış şekillerine denir. Gözlemlerde kullanılan ölçü biriminin araştırmaya uygun olması gerekir. Tabi ki şıkların alacakları değerler de (ilgilenilen değişken sürekli veya kesikli olsun fark etmez) sonlu olmalıdır. Şıkların aldığı ölçü birimleri de ilgilenilen olaya uygun olmalıdır. Kilo, şişe, teneke, gram vb C. Anakütlenin Sınıflandırılması Veriler hangi yöntemle toplanırsa toplansın, elde edilen veriler genellikle istatistiksel analize hazır değildir (bu veriler ham veri olarak adlandırılır) Bu verilerin analize uygun hale getirilmesi için düzenlenmeleri gerekir. Veri Derleme Türleri: Ani ve sürekli veri derleme: sürekli birimlerin belli bir andaki durumlarını gözlemlemek için yapılan derlemelere ani derleme; ör: nüfus ve işyeri, tarım ve sanayi sayımları sayılabilir. Sürekli veri derleme,olayların aynı anda ve bir arada meydana gelemedikleri durumda sürekli olarak incelenmesidir. Anlık birimlerin belirli bir zaman aralığında gözlemlenmesidir. belirli bir bölge ve zamanda evlenme, boşanma, trafik kazası oranları Direkt ve Endirekt veri derleme: doğrudan ana kütle birimlerinin gözlemlenmesi durumunda direkt;söz konusu anakütle ile birlikte diğer anakütle birimlerinin gözlemlenmesi durumu ise endirekt veri derlemedir. Doğrudan nufus sayımı ile ülkede yaşayan sayısı tespit edilebileceği gibi bunun yanında konut sayımı ile de nufus tespiti yapılabilir. Birincil ve İkincil veri derleme: bilgi edinmek için yapılan derlemelere birincil (anlık), idari ve mali amaçlarla yapılan derlemelere ikincil (sürekli) veri derleme denir. Asıl ve yardımcı şeklinde veri derleme: anakütleyi oluşturan birimlerin özelliklerinin belirlenmesi amacıyla yapılan derlemeye asıl, asıl derlemeye yardımcı olmak için yapılan derlemeye yardımdı denir. Genel ve kısmi veri derleme: bilgi edinilmek istenen kütlenin tamamının gözlenmesine genel veri derleme, genel nüfus sayımları vb.; bilgi edinmek istenen kütleyi oluşturan birimler arasından belirlenen amaçlar doğrultusunda yanlızca bir kısmının seçilip gözlenmesine kısmı veri derleme denir. Pahalı oluşu, zaman alışı, gözlem birimlerinin fiziksel zarara uğraması vb nedenlerle kısmi veri toplanır. Kısmi veri derleme: ÖRNEKLEM (örneği oluşturmak için anakütleden seçilen birimlerin oluşturduğu topluluktur. Topluluğu oluştururken seçilen teknikler şunlardır: Rassal (tesadüfi)örneklem : anakütledeki her bir birimin örneğe girme şansı eşit ise rassal örnekleme İradi (isteyerek) örneklem: girmesi mümkünler arasında eşit şans gözetilmez/ fark gözetilirse olur. (7.bölümde ayrıntılı anlatılacaktır.) 27.04.2017 Selami ÖZCAN İstatistik

Değişken nedir? Kaça ayrılır? Değişken (Özellik): gözlemden gözleme değişik değerler alabilen objelere, özelliklere veya durumlara denir. İstatistik birimlerin sahip oldukları özellikler değişken,değişkenlerin aldıkları değerlere ise şık tır Doğum yerleri, yaş, ağırlık, uzunluk vb. özellikler değişkendir. Aldıkları değerlere de şık denir. Değişken Türleri: 1.Mekan değişkeni:değişkenin şıklarının mekana göre oluştuğu değişkenlerdir. Doğum yeri, Üniversitenin kurulduğu şehir vb., 2.Zaman değişkeni:değişkenin şıklarının zamana göre oluştuğu değişkenlerdir. Doğum yılı, Üniversitenin kuruluş yılı vb. 3.Maddi değişkeni:mekan ve zaman değişkenin dışındaki değişkenler. İnsanların medeni hali, birim değişken maliyetler, istatistikten alınan notlar vb. 1. KALİTATİF (Sayısal olmayan) değişkenler Değişik derecelerde az veya çok değerler alan değişkenlerdir. Ör: doğum yeri, göz rengi, ırk, nüfus, cinsiyet, medeni durum, din vb. 2. KANTİTATİF (Sayısal) değişkenler Gözlemden gözleme farklılık gösterirler fakat bu farklılık derece yönünden değil kalite, miktar ve çeşit yönündendir. Ör: yaş, ağırlık, zeka seviyesi, hava sıcaklığı, Hesabınızdaki bakiye, sınıftaki öğrenci sayısı vb. 27.04.2017 Selami ÖZCAN İstatistik

DEĞİŞKENLERİN SINIFLANDIRILMASI bir ailedeki çocuk sayısı bir yılda satılan bilgisayar sayısı bir kişinin kilosu bir kişinin boyu 27.04.2017 Selami ÖZCAN İstatistik

KANTİTATİF (SAYISAL) DEĞİŞKENLER 2. Sürekli değişkenler (belirli aralıkta sonsuz sayıda değer alabilen değişkenlere denir) Ölçülen ve tartılan değişkenler Ör: yaş, uzunluk ve ağırlık vb 1. Kesikli değişkenler (yalnız belirli tamsayı değerleri alabilen) Sayılabilen değişkenler Ör: cinsiyet, medeni durum 27.04.2017 Selami ÖZCAN İstatistik

Veri kaynakları, Veri toplama araçları ve yöntemleri Veri toplama yöntemleri Anket (yazılı iletişim) Geleneksel cevaplayıcının yönettiği, Posta Faks Elden bırakıp alma araştırmacının yönettiği Telefonla anket Biçimsel olmayan mülakat Modern e posta anketi İnternet anketi Mesajlaşma Gözlem (olayların ortaya çıktığı sırada sistematik biçimde inceleme tekniğidir) Katılımlı gözlem Dışarıdan gözlem Doğal gözlem Simülasyon gözlemi(kişi/grup oyun) Görüşme: tek tek veya grup ile sözlü veya hareketli iletişim yoluyla veri toplama yöntemidir. Deney Veri Kaynakları Birincil Veriler Anket Gözlem (örnek olay) Mülakat İkincil Veriler Dokümantasyon (yazılı) Çok kaynaklı (alan çalışması, zaman serileri) Anket (sayımlar ve anketler) Veri Toplama Araçları Soru kağıdı (anket formu) Açık uçlu sorular (size göre…) Kapalı uçlu sorular (evet, hayır) Anketör (gözlemci) Ücretli, gönüllü zorunlu Devamlı, geçici 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Ölçme ve Ölçekler Ölçme: nesne veya fertlere belirli bir özelliğe sahip oluş derecelerini belirtmek için belirli kurallara uyarak sembolik değerler verme işlemine denir. İstatistiki bir araştırmaya konu olan verileri ölçmeye yarayan ölçekler 4’e ayrılır. Nominal(sınıflama) ölçek: istenen özelliğin olması(1) olmaması(0) hatalı-hatasız, kız-erkek, Ordinal (sıralama) ölçek: yarışmacıların sıralanması 1., 2., 3., veya 1. tercih, 2. tercih, likert tipi sıralama, hiç beğenmedim(1) beğenmedim(2) biraz beğendim(3), beğendim(4), çok beğendim(5) Aralık ölçeği: belirli iki değer arasında sonsuz değer alır. Bu durum için aralıklar belirlenir. 500 altı, 500-1000 ytl, 1001-1500 ytl, 1501-2000 ytl, 2001 ve üzeri Oran ölçeği: ağırlık ve boy ölçüleri , metre, kg gibi 27.04.2017 Selami ÖZCAN İstatistik

Ölçeklerde Uygulanabilecek İstatistikler Mukayese Ortalama Örnekler Nominal Kimlik Mod Cinsiyet, göz, saç rengi, meslekler, araba plakaları, forma no vb. Ordinal Sıralama Medyan Marka tercihi, sosyal sınıflar, bölüm tercihi, ilk 500 firma vb. İnternal Aralık Aritmetik Sıcaklık ölçeği, başarı puanı, markaya karşı tutum, vb. Rasyo Oran Tüm işlemler Satış miktarı, müşteri sayısı, ağırlık, zaman, mutlak değer olan herşey 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik ANALİZ TEKNİKLERİ 1. DEĞİŞKEN SAYISINA GÖRE Tek değişkenli (değişken üzerinde değişik grupların veya cevapların dağılımı) t testi, z testi, ki kare, one way anova testi, mann whitney u testi Çok değişkenli (bağımlı ve bağımsız değişken) korelasyon, regresyon, faktör, ayrım ve kümeleme analizi 2. AMAÇLARA GÖRE Farklılıkların tespitine yönelik t testi, ki kare testi, z testi, anova testi İlişkilerin şiddetini ölçmeye yönelik Bağımlılık ölçümü 27.04.2017 Selami ÖZCAN İstatistik

ANALİZ TEKNİKLERİ 3.Veri Özelliklerine Göre Parametrik analiz teknikleri ve ön şartları z testi: örnek büyüklüğü n>=30 t testi: örnek büyüklüğü n<30 F testi: varyans analizi Ki kare testi Anova testi One way anova Korelasyon Regresyon Çok değişkenli analiz teknikleri Ön şartları Verilerin aralık/oran ölçeğinde ölçülmüş olması gerekir Veriler normal dağılım göstermeli Hedef kitlede yer alan bütün gruplar aynı varyans değerine sahip olmalı Hata değerleri tesadufi olmalıdır Parametrik olmayan analiz teknikleri Tek örnek durumu için İşaret testi K S testi Run testi Eşlenik çift örnek durumu için Wilcoxun eşlenik testi İki bağımsız örnek durumu için Mann Witney U testi (t testi ile aynı) Wilcoxin sıra toplam testi Wilcor sıra sayıları testi İkiden fazla örnek durumu için Kuruskev Walls testi Frigman testi 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik İKİNCİ BÖLÜM İSTATİSTİK SERİLERİ (FREKANS DAĞILIMLARI) Niçin frekans dağılımı yapılır? Veriyi gruplara ayırarak anlaşılabilir hale getirmek için Gözlenme sıklıklarını ve ihtimallerini belirlemek için 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 2.Bölüm: Sunum Planı Seri türleri Kantitatif seriler Zaman ve mekan serileri Frekans dağılımları Kümülatif seriler Birleşik seriler Kalitatif seriler Serilerin grafikle gösterimi 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik İstatistik serileri İstatistik serileri : gözlem değerlerini (ham verileri) anlamlı kılma (büyüklüklerine göre sıralama) yollarından biridir. Seriyi oluşturan gözlem değerlerinin her birine terim denir. Kütleyi oluşturan kollektif olayların her birine birimdir. Terim ise birimleri oluşturan gözlem değerlerinden her biridir. Terim sayısı ile birim sayısı birbirine eşit olur. Seri türleri 1. Kantitatif seriler Zaman ve mekan serileri: gözlem sonuçlarının (yıl,ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman; yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. Frekans Serileri: bu serilere bölünme, dağılma serileri de denir. Ham verilerin basit seri, frekans serisi ve sınıflandırılmış/gruplandırılmış seri şekline dönüştürülmesidir. Kümülatif (birikimli) seriler: Bileşik seriler: gözlem değerlerini iki veya daha fazla değişkene göre hir araya getiren serilere denir. Aylık gelir ve gider arasındaki ilişkinin ölçülmesi 2. Kalitatif seriler (dikey eksende frekanslar, yatay eksende sınıf veya grup değerlerinin yazıldığı grafik şeklidir. Simetrik:normal dik ve basık seriler), asimetrik(sağa ve sola eğik) seriler; çok tepeli ve J/ters J şeklinde seriler ve U şeklinde seriler vardır. Verilerin grafikle gösterilmesi Basit serinin grafikle gösterilmesi: Çubuk grafiği Sınıflandırılmış serinin grafikle gösterilmesi: Histogram, Frekans poligonu, Birikimli (kümülatif)serilerin grafikle gösterilmesi Bileşik serilerin grafikle gösterilmesi 27.04.2017 Selami ÖZCAN İstatistik

Zaman ve mekan serileri ZAMAN SERİSİ: gözlem sonuçlarının (yıl, ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman serisi Yıllar Satışlar 1990 2500 2000 3200 2010 4800 MEKAN SERİSİ: gözlem sonuçlarının yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. İller Satışlar İstanbul 8500 Ankara 3200 İzmir 4800 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Frekans Dağılımları 2. FREKANS SERİSİ: basit seriyi özetlemek veya daha anlaşılır hale getirmek için yapılır. Frekans:tekrarlanma sayısıdır. Frekans serisi ise:gözlem değerlerinin yanına kaç kez tekrarlandığı yazılarak oluşturulan seridir. f harfi ile ifade edilir. ÖRNEK1: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz X f 0 3 1 4 2 5 3 6 4 3 5 2 6 1 8 1 Toplam 25 Ham veri: gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığınıdır. 1. BASİT SERİ: elde edilenen ham verilerin büyükten küçüğe veya tersi alt alta veya yan yana sıralanmasına denir. ÖRNEK1: Bir işletmede 25 çalışana verilecek çocuk yardımı ile ilgili bir araştırma yapılmaktadır. çalışanların çocuk sayıları aşağıda verilmiştir. Ham veri: 0 , 1 , 3 , 3 , 2 , 1 , 0 , 8 , 4 , 2 , 3 , 2 , 5 , 0 , 6 , 3 , 5 , 4 , 1 , 3 , 2 , 2 , 3 , 1,4 Basit seri: 8 , 6 , 5 , 5 , 4 , 4 , 4 , 3 , 3 , 3 , 3 , 3 , 3 , 2 , 2 , 2 , 2 , 2 , 1 , 1 , 1 , 1 , 0, 0, 0 Örnek 2.Ham veriler Basit seri . 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 3. SINIF/GRUPLANDIRILMIŞ SERİ Hesaplama kolaylığı için eşit büyüklükte sınıf/gruplandırılır. Grup aralığını gösteren “aralık katsayısı”nın bulunması için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini/istenen grup sayısına bölünür. Az sayıda grup veri kaybına, çok sayıda grup işlemlerin zorlaşmasına neden olur. İlgili kavramlar Sınıf Değeri/orta noktası: Her grub veya sınıf bir sayı ile temsil edilir. Bu sayı her grubun orta noktasıdır. Buna sınıf değeri denir. Bu sınıf değeri frekans serisindeki X değeri gibi işlem görür. alt ve üst sınıf uçlarının veya alt ve üst sınıf sınırlarının toplanıp ikiye bölünmesiyle elde edilir. Sınıf büyüklüğü veya aralığı: alt ve üst sınırlar arasındaki farka denir. h ile gösterilir. Başlangıç ve bitiş sınırları belirtilmeyen sınıflara açık sınıflar denir. Sınıf aralığı dar tutulursa sınıf sayısı artar frekans dağılımının anlaşılması zorlaşır. Geniş tutulursa sınıf sayısı azalır sonuçta dağılıma ait bazı değerler gizli kalır. Uygulamada sınıf sayısı: 7-20 yada 10-30 arasında olmalıdır. Sürekli gruplandırılmış seri: sınıf uçları sınıf sayısına eşitse yani bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlıyorsa sürekli gruplandırılmıs seri demektir. Sınıf sınırları: sürekli gruplandırılmış bir seride her sınıfın alt ve üst değerlerine denir. Sınıf uçları: Her sınıfın ilk rakamı alt sınıf ucu, son rakamı ise üst sınıf ucudur. Sınıf uçları sınıf sınırlarına eşittir. Kesikli gruplandırılmış seri: bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlamıyorsa kesikli gruplandırılmıs seri denir. sınıf sınırları: kesikli gruplandırılmış bir seride bir üst sınıfın alt ucundan bir alt sınıfın üst ucu çıkarılıp ikiye bölünerek elde edilir. Bu değer bütün alt sınıf uçlarından çıkarılır ve bütün üst sınıf uçlarına eklenir. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 3. Sınıf/ Gruplandırılmış seriye Örnekler Sınıf /Grup Aralık Katsayı formülü: (en yüksek – en düşük) / istenen sınıf/grup sayısı Sınıf /Grup Sayısı formülü: eşitsizliği dikkate alınır. k sınıf sayısı n: toplam veri sayısı . . ÖRNEK: Daha önce frekans serisi olarak düzenlenen örneği 2 eşit aralıklı gruplandırılmış seri olarak düzenleyiniz. Frekans SınıflGruplandırılmış X f Sınıflar frekans 0 3 0-2 7 1 4 2-4 11 2 5 4-6 5 3 6 6-8 1 4 3 8-10 1 5 2 toplam: 25 6 1 8 1 Top:25 10 sınıf olacak şekilde (94-28)/10=6,2yaklaşık 7 aralık katsayısı olur;28 dahil 7 sayarsak ilk sınıf 28-34 olur. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Örnek1: 100 öğrencinin istatistik dersinden aldığı notlar aşağıdaki gibidir. 89, 57, 57, 93, 97, 65, 33, 71, 42, 85, 47, 63, 76, 49, 88, 82, 50, 62, 93, 39, 76, 84, 54, 87, 56, 39, 49, 70, 74, 77, 81, 99, 73, 48, 57, 89, 55, 73, 86, 35, 66, 79, 85, 72, 91, 39, 49, 84, 66, 58, 65, 81, 84, 43, 62, 95, 58, 64, 77, 93, 74, 68, 76, 65, 61, 81, 37, 45, 89, 22, 50, 68, 87, 51, 45, 89, 95, 87, 91, 43, 71, 93, 67, 49, 65, 96, 84, 79, 77, 80, 93, 65, 89, 99, 64, 53, 62, 86, 69 Bu verilere göre Notların değişim aralığını bulunuz. Bu verileri basit seri haline getiriniz. Bu verileri sınıf büyüklüğü 10 olacak şekilde gruplandırarak bir frekans dağılımı teşkil ediniz. İlk sınıf 20-29 olsun 50 den az puan alan öğrenci sayısını bulunuz. 70 veya daha yukarı puan alan öğrenci sayısını bulunuz. C şıkkındaki sınıflandırmaya göre her sınıfa ait sınıf değerini ve sınıf sınırlarını bulunuz C şıkkındaki sınıflandırmaya göre bir histogram ve frekans poligonu çiziniz. “..den az kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramı ve ojiv eğrinisini elde ediniz. “..den çok kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramını ve ojiv eğrisini elde ediniz. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Çözüm1: 99-22=77 . c. Sınıf frekanslar 20-29 1 30-39 6 40-49 11 50-59 12 60-69 18 70-79 16 80-89 22 90-99 14 d. 50 den az denildiği için 1+6+11=18 dir e. 70 ve daha fazla denildiği için 16+22+14=52 f. Sınıflar alt sınır üst sınır sınıf değeri/orta noktası 20-29 19,5 29,5 24,5 30-39 29,5 39,5 34,5 g. Frekans 20 15 10 19,5 29,5 39,5 49,5 59,5 69,5 79,5 89,5 99,5 h . “..den az küm.frekans 1, 7, 18, 30, 48, 64, 86, 100 “.. den çok küm.frekans 100, 99, 93, 82, 70, 52, 36, 14 den az den çok 100 75 50 25 22 45 51 61 65 71 77 84 88 93 33 53 62 72 89 35 47 54 66 73 79 37 48 55 85 95 39 49 56 63 67 74 80 57 64 68 81 86 76 91 96 42 69 87 97 43 50 58 70 82 99 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Örnek 2: Yalova Termal otele 75 ay boyunca aylık gelen turistlerin sayısı aşağıdaki gibidir. Sınıf sayısı en az 8, en çok 15 olacak şekilde çetele tablosunu ve sınıflandırmayı ve sınıf orta noktasını bulunuz? 115 94 110 103 92 104 114 106 100 102 95 97 113 98 101 99 93 107 96 108 90 111 105 91 109 112 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Sınıflar    Çetele    Frekans Sınıf Orta Noktası 90-92  ///   3 (90+92)/2=91 93-95   ///// 5 =94 96-98    ///// ///   8 =97 99-101     ///// ///// //   12 =100 102-104   ///// ///// ////   14 =103 105-107  ///// ///// /  11 =106 108-110    ///// ////   9 =109 111-113    ///// ///   8 =112 114-116    /////  5   =115 Toplam     75 ÇÖZÜM2: Sınıflar 90-92 93-95 96-98 99-101 102-104 105-107 108-110 111-113 114-116 1. adım: Dağılımdaki en büyük ve en küçük değer bulunur. Örneğimizdeki en büyük değer 115, en küçük değer 90 2. adım: En büyük değerden en küçük değer çıkarılarak dağılım aralığı bulunur. Değişim aralığı = En büyük değer- En küçük değer  Dağılım aralığı= 115-90=25 3. adım: Dağılım aralığı bir kez 8'e bir kez 15'e bölünerek(sınıf sayısının en az 8, en çok 15 olmasını önerildiği için) sınıf aralığı saptanmaya çalışılır. 25÷8=3.1, 25÷15=1.6'dır. 1.6 ile 3.1 arasında herhangi bir değer sınıf aralığı olarak seçilebilir. Eğer sınıf aralığını 3 olarak alırsak yaklaşık 8-9 sınıf elde ederiz, sınıf aralığını 2 alırsak sınıf sayımız 12-13 arasında olur. Burada sınıf aralığı 3 olarak alınmıştır. Sınıflar şu şekilde En küçük değer 90 olduğundan ilk sınıfın alt sınırı 90 ile başlatılmıştır. Tüm sınıf sayımız ise 9'dur. Bütün değerler sınıflamaya dahil edilmiştir. 4. Adım: Sınıflar saptandıktan sonra her bir değerin hangi sınıfa gireceğine bakılır. Örneğimizdeki ilk değer 115'dir. Bu değer 114-116 sınıfına gireceği için bu sınıfın karşısına bir çizgi çizilir. Sonra geri kalan değerler teker teker ait oldukları sınıfın karşısına işaretlenir. Buna "Çeteleme" denir. Sonra çeteleler sayılır ve her sınıfın karşısına yazılır. Örnek dağılımımızın çetele ve sayı ile gösterilmesi 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Frekans serisi ve gruplandırılmış seriye örnek (4 sınıflı gruplar oluşturulacak) Frekans serisi X frekans 5 2 7 4 8 12 10 8 11 6 12 5 16 3 Top 40 Gruplandırılmış seri Gruplar frekans 5.00-7.75 6 7.75-10.50 20 10.50-13.25 11 13.25-16.00 3 Toplam 40 27.04.2017 Selami ÖZCAN İstatistik

Frekans serisinin gruplandırılmış seriye dönüşümü 27.04.2017 Frekans serisinin gruplandırılmış seriye dönüşümü 1.adım: En yüksek X değerinden en düşük X değeri çıkarılır sınıf sayısına bölünür. (16-5)/4= 2,75 (sınıf büyüklüğü) bu değer serideki en küçük değer (5)e kümülatif olarak eklenir. 2. adım: örnekteki frekans seriyi eşit aralıklı 4 sınıflı sürekli gruplandırılmış bir seri haline getirelim. 5+2,75=7,75 olur. Sürekli gruplandırılmış seri kesikli gruplandırılmış seri (aralık 3) grup f grup frekans nisbi frekans ilk aralık 5-7,75 6 4, 50-7,50 6 6/40 7,75-10,50 20 7,75-10,75 20 20/40 10,50-13,25 11 11,00-14,00 11 11/40 13,25-16,00 3 14,25-17,25 3 3/40 top 40 top 40 40/40 Sınıf sınırları: 5-7,75;7,75-10,50;10,50-13,25;13,25-16,00 Sınıf büyüklüğü: 7-75-5,00=2,75 Sınıf değeri: (5,00+7,75)/2=6,375 27.04.2017 Selami ÖZCAN İstatistik

Kümülatif (Birikimli) Frekanslar Bazı istatistiksel çalışmalarda bir frekans serisinde veya gruplandırılmış seride belirli bir değerden daha küçük veya daha büyük değer alan birim sayısının belirlenmesi gerekebilir. Bu durumlarda kümülatif frekanslar hesaplanır Her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan seriye KF denir. ..den az: küçükten büyüğe doğru oluşturulur. ..den çok: büyükten küçüğe doğru oluşturulur. 27.04.2017 Selami ÖZCAN İstatistik

Kümülatif Frekans Dağılımları Sınıflar f 5-7,75 6 7,75-10,50 20 10,50-13,25 11 13,25-16,00 3 40 ..den az küm.f. ..den çok küm.f. 7,75 den az 6 5,00 den çok 40 10,50 den az 6+20=26 7,75 den çok 40- 6=34 13,25 den az 26+11=37 10,50 den çok 34-20=14 16,00 den az 37+ 3=40 13,25 den çok 14-11= 3 ..den az küm.nisbi f. ..den çok küm.nisbi f. 7,75 den az 6/40=15 5,00 den çok 40/40=100 10,50 den az 26/40=65 7,75 den çok 34/40= 85 13,25 den az 37/40=92,5 10,50 den çok 14/40= 35 16,00 den az 40/40=100 13,25 den çok 3/40= 0,75 ..den az kümülatif Frekans dağılımları ..den çok kümülatif Frekans dağılımları ..den az küm.nisbi frekans dağılımları ..den çok küm.nisbi frekans dağılımları Sınıflar f 5-7,75 6 7,75-10,50 20 10,50-13,25 11 13,25-16,00 3 40 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik SORU 2015 verileri ile dünyadaki 30 büyük şehir nüfuslarına göre gruplandırılarak frekans dağılımları gösterilmektedir. Nüfus grupları(*1000 kişi) şehir sayısı(frekans) 3000 - 4000 den az 6 4000 - 5000 den az 6 5000 - 6000 den az 4 6000 - 7000 den az 6 7000 - 8000 den az 2 8000 - 9000 den az 4 9000 ve üzeri 2 Yukarıdaki tabloyu kullanarak ; a. .. den az küm. frekans ve .. den çok küm. frekansları bulunuz? b. ..den az küm.nisbi ve ..den çok küm. nisbi frekansları bulunuz? c. Şehir nüfusu 6000 den az olan şehir sayısı kaçtır? d. Şehir nüfusu 8000 ve üzeri olan şehir sayısı kaçtır? e. Şehir nüfusu en az 5000 ve 8000 den az olan şehir nüfusu kaçtır? f. Histogram, frekans poligonu ve ojiv eğrilerini çiziniz? 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Çözüm a ve b şıkları ...den az ...den çok ...den az ...den çok Nüfus grupları(*1000 kişi) f küm. frekans küm.frekans küm.nisbi frekans küm.nisbi frekans 3000 - 4000 den az 6 6 30 6/30= 30/30= 4000 - 5000 6 12 24 12/30= 24/30= 5000 - 6000 4 16 18 16/30= 18/30= 6000 - 7000 6 22 14 22/30= 14/30= 7000 - 8000 2 24 8 24/30= 8/30= 8000 - 9000 4 28 6 28/30= 6/30= 9000 ve üzeri 2 30 2 30/30=1.00 2/30= c. Nüfusu 6000 den az şehir sayısı 16 dır. d. Nüfusu 8000 ve üzeri olan şehir sayısı 6 dır. e. Nüfusu 5000 ile 8000 den az olan şehir sayısı 18- 8=10 dur. f. 27.04.2017 Selami ÖZCAN İstatistik

BİLEŞİK SERİLER (Bağımlı/bağımsız) Birimlerin birden fazla değişkene göre dağılımlarını bir arada gösteren serilerdir. Bir bileşik serinin ilk sütunu değişkenin gözlem değerleri, diğer sütunda ise ilgili değişkenlerin ilk değerleri yer alır. Birim seçimi (öğrenci) Değişken (uzunluk ve ağırlık) Örnek: Öğrenci gözlem no Uzunluk(m) X Ağırlık (kg) Y 1 1.72 68 2 1.68 70 3 1.80 76 4 1.74 73 5 1.76 71 27.04.2017 Selami ÖZCAN İstatistik

SERİLERİN GRAFİKLE GÖSTERİLMESİ HİSTOGRAM FREKANS POLİGONU 27.04.2017 Selami ÖZCAN İstatistik

Frekans dağılımların grafikle gösterilmesi 1.DİYAGRAMLAR (Çubuk ve alan grafikleri) Çubuk grafiği, gözlem değerleri x=2, 4, 6, 8, 10 yatay eksen Dikey eksende frekans değerleri: 2, 4, 7, 3, 1 2.FREKANS POLİGONU YATAY EKSEN DİKEY EKSEN BU KOORDİNAT SİSTEMİNE GÖRE OLUŞAN ŞEKİL 27.04.2017 Selami ÖZCAN İstatistik

Histogram ve frekans poligonu, Histogram: dikdörtgenler dizisidir. Tabaları her bir sınıfın sınıf büyüklüğünü, yüksekliği ise frekansları gösterir Frekans Poligonu: dikdörtgenlerin üst kenarlarının orta noktaları birleştirilmek suretiyle elde edilen grafiğe denir. Başlangıç noktası ilk sınıftan bir önceki farazi sınıfın orta noktasıdır.bitiş ise son sınıftan sonraki farazi sınıfın orta noktasıdır. Her ikisinin kapsadığı alan birbirine eşittir. frekanslar histogram 20 15 Frekans poligonu 10 5 gruplar 5,00- 7,75 10,50 13,25 16,00 27.04.2017 Selami ÖZCAN İstatistik

HİSTOGRAMA ve FREKANS POLİGONUNA ÖRNEK Sınıflar Frekanslar (f) Sınıf aralıkları (h) Ayarlanmış frekanslar (f/h) 0-4 12 4 12/4=3 4-8 16 16/4=4 8-12 20 20/4=5 12-16 24 24/4=6 16-20 20-24 8 8/4=2 Frekans poligonu Ayarlanmış frekanslar 6 5 4 3 2 0 4 8 12 16 20 24 sınıflar 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 27.04.2017 Selami ÖZCAN İstatistik

VERİ ANALİZİ HİSTOGRAM: FREKANS FREKANS FREKANS DEĞİŞKEN DEĞİŞKEN DEĞİŞKEN SİMETRİK HİSTOGRAM SAĞA ASİMETRİK HİSTOGRAM SOLA ASİMETRİK HİSTOGRAM Histogramlar; spesifikasyon ve sonuç arasındaki ilişkilerin araştırılmasında, normal olmayan verilerin belirlenmesinde, malzeme ve değişik verileri sınıflandırarak bir operasyonel-finansal sürecin içerisinde değişikliklere neden olan faktörlerin gözden geçirilmesinde kullanılmaktadır. 33

KÜMÜLATİF SERİLERİN GRAFİKLE GÖSTERİMİ Sınıflar : 0-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, Frekanslar: 3, 12 25 30 15 10 5 = 100 den az ve den çok serileri oluşturunuz? Sınıflar yatay, frekanslar dikey ekseni gösterir. den az = 3, 15, 40, 70, 85, 95, 100 den çok=100, 97, 85, 60, 30, 15, 5 ..den az 100 ..den çok 80 27.04.2017 Selami ÖZCAN İstatistik

Bileşik serilerin grafikle gösterimi Y X 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik GRAFİKLER Araştırma sonucunda elde edilen ve düzenlenen verilerin daha kolay anlaşılabilmesi için gösterildiği şekillere grafik denir. Grafikler göze hitap ettikleri için, toplanan verilerin daha açık bir şekilde görülmesine ve yorumlanmasına yardımcı olur. Buradaki en önemli nokta grafiklerin açık ve anlaşılır biçimde çizilmeleridir. 27.04.2017 Selami ÖZCAN İstatistik

Verilerin grafikle gösterilmesi Sütun/Bar grafiği Pasta grafiği Çubuk Çizgi Alan XY dağılımı Silindir Örnekler verilecek Radar grafiği Halka grafiği Hisse senedi Kabarçık Yüzey Koni grafiği Pramit grafiği 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik BAR GRAFİK İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Diğer soru örnekleri Soru 1: Aşağıda 50 öğrencinin istatistik I dersinden aldığı notlar verilmiştir. Sınıf/Grup sayısı 10 olacak şekilde frekans tablosunu oluşturunuz? 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Soru 2: Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline gelen toplam 911 çağrının 36 günlük dağılımını göstermektedir 22 76 6 23 54 31 30 27 35 19 71 48 17 30 48 28 105 22 63 41 26 37 35 44 11 41 64 65 52 63 8 34 38 32 43 30 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Soru 3: Aşağıdaki 60 adet veriyi önce basit seriye sonra frekans serisine dönüştürünüz? 5,9 7,7 8,9 5,2 7,3 6,3 5,7 5,6 6,7 6,9 7 6,2 6,5 9,2 7,1 4,1 4,9 7,5 9,6 7,9 5,3 5,5 6,1 8,3 8,1 4,5 9,4 5,8 8,7 9,1 5,1 9,3 6 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Soru 4: Bir fabrikada çalışan işçilerin aylık ücretleri ve bu ücreti alan işçilerin yüzde dağılımları şöyledir. Aylık Ücret (*100 tl) İşçi Yüzdesi 1000 den az 17,2 1000 - 1999 11,7 2000 - 2999 12,1 3000 - 3999 14,8 4000 - 4999 15,9 5000 - 5999 11,9 6000 – 6999 12,7 7000 ve üzeri 3,6 Yukarıdaki tabloyu kullanarak ; a. 1.sınıf ne şekilde yazılmalıdır ki büyüklüğü 2.sınıfınkine eşit olsun? b. Aylık 4000 tl ve üzeri ücret alan işçilerin yüzdesi kaçtır? c. En az 3000 tl fakat 5000 tl den de az alan işçilerin yüzdesi kaçtır? d. Aylık ücreti 6000 den az olan işçilerin yüzdesi kaçtır? e. Yüzdeler toplamı neden %100 çıkmamıştır.? 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik SORU 5 X yılı verilerine göre çalışanların çalışma statüleri aşağıda gösterilmiştir. Sütun/bar ve pasta grafiklerini çiziniz? Ücretli çalışanlar 6.283.355 Mevsimlik/Yevmiyeli çalışanlar 1.347.728 İşverenler 1.118.950 Kendi hesabına çalışanlar 4.905.037 Ücretsiz/aile işçisi 6.129.021 Toplam 19.784.091 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Soru 6: 30 adet borunun et kalınlıkları mm olarak ölçülmüş sırasıyla aşağıdaki değerler bulunmuştur 4,45 4,65 4,84 4,85 4,95 4,95 5,05 5,05 5,05 5,24 5,25 5,25 5,25 5,25 5,25 5,35 5,44 5,44 5,44 5,44 5,55 5,55 5,55 5,55 5,65 5,65 5,75 5,85 6,15 6,25 a. Sınıf sayısı 10 olacak şekilde sınıf aralığını bularak sınıfları oluşturunuz. b. Sınıf alt ve üst sınır uçları ile sınıf değerlerini bulunuz. c. Histogram ve frekans poligonunu çiziniz. 27.04.2017 Selami ÖZCAN İstatistik

Soru 7: İŞL 243 dersi ara sınav notları (n = 38) a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını (2k > n  2k > 38  k = 6 (64 > 38) ve sınıf aralığını (max-min/ k) bulunuz c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz. 27.04.2017 Selami ÖZCAN İstatistik

Soru 8: İktisat 2. sınıfların yaşları aşağıdaki gibidir.(n=26) a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını ve sınıf aralığını (max-min/ istenen sınıf sayısı) bulunuz c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik ÜÇÜNCÜ BÖLÜM MERKEZİ EĞİLİM (YER) ve DEĞİŞKENLİK ÖLÇÜLERİ 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 3. BÖLÜM: Sunum planı 1. Merkezi eğilim ölçüleri Parametrik Merkezi eğilim ölçüleri (Duyarlı) Aritmetik ortalama X Geometrik ortalama G Harmonik ortalama H Kareli ortalama K Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız) Mod Medyan Kantiller (kartiller, desiller, pörsentiller) 2. Dağılım / değişim ölçüleri Parametrik dağılım/değişim ölçüleri Değişim aralığı (Ranj) Kartil aralığı Desil aralığı Parametrik olmayan dağılım/değişim ölçüleri Ortalama sapma Varyans Standart sapma Değişim katsayısı 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 1. Merkezi Eğilim Ölçüleri bir veri kümesinin ortasını belirleme eğiliminde olan sayısal değerdir. Gözlem değerlerinin etrafında toplanma eğilimi gösterdiği değerdir. Parametrik Merkezi eğilim ölçüleri (Duyarlı ortalamalar: serideki tüm gözlem değerlerinden etkilenen ortalamalardır.) Aritmetik ortalama X:Deneklerin aldıkları değerlerin toplanıp denek sayısına bölünmesiyle elde edilen değerdir Geometrik ortalama G= Harmonik ortalama H= Kareli ortalama K= Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar) Medyan (ortanca):Bir ölçek üzerinde orta noktanın yerini gösteren bu ölçü tüm değerleri ortadan ikiye bölen değerdir Mod:Ölçümlerde en fazla tekrar edilen değere mod denir Kantiller (kartil desil pörsentil) Ortalama kartil Parametrik merkezi eğilim ölçülerindeki ortalamaların değeri, serinin herhangi bir biriminin değeri değiştiğinde değişir. Yani değişikliklere duyarlı olan ortalamalar. Parametrik olmayan merkezi eğilim ölçülerindeki ortalamaların değerinin değişmesi için bu ortalamaların hesabında kullanılan birimlerin değerinin değişmesi gerekir. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Aritmetik Ortalama ͞x Serideki bütün rakamlardan etkilenen ve en çok kullanılan ortalamadır. Özellikleri: Duyarlı bir ortalamadır, aşırı değerlerden etkilenir. Gözlem değerlerinin aritmetik ortalamadan sapmaların toplamı sıfırdır. (x-x)=0 Gözlem değerlerinin aritmetik ortalamadan sapmaların kareleri toplamı minimumdur.(x-x)²=min 27.04.2017 Selami ÖZCAN İstatistik

Basit Serilerde Aritmetik Ortalama: ͞x= Σx/n Puan toplamlarının veri sayısına bölümüdür. Örnek1 Örnek 2: X X 10 95 12 88 18 73 20 67 Top.60 59 X=60/4=15 46 35 26 23 Top: 512 X=512/9=56,88 27.04.2017 62

Selami ÖZCAN İstatistik Frekans Serisinde Aritmetik Ortalama X f fx ͞x=Σfx/Σf X=69/10=6,9 4 1 4 5 2 10 7 4 28 9 3 27 Σf=10 Σfx=69 27.04.2017 Selami ÖZCAN İstatistik

Gruplandırılmış Seride Aritmetik Ortalama Gruplar Frekans Ort değ.(x) fx 2-4 2 [(2+4)/4] 3 6 5-7 13 6 78 8-10 4 9 36 11-13 1 12 12 Σf=20 Σfx=132 X=132/20=6,6 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Tartılı Aritmetik Ortalama bir serideki değerler arasında önem derecesi farklı oluyorsa bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için önem düzeyini gösteren katsayılar (tartılar) kullanılır. Basit seride: Xt= Σtx/Σt frekans serisinde: Xt=Σtfx / Σtf Gruplandırılmış seride: Xt=Σtfm/Σtf Örnek: aşağıda öğrencinin almış olduğu dersler ve kredileri verilmiştir. Tartılı ortalamasını hesaplayınız. Dersler Not(X) Kredi(t) t X Üretim Yönetimi 85 3 255 İstatistik 89 3 267 İktisat 55 4 220 Matematik 60 2 120 Pazarlama 100 3 300 Toplam Σt=15 Σtx=1162 tX=1162/15=77,47 27.04.2017 Selami ÖZCAN İstatistik

Geometrik ortalama (G) Örnek (basit) X=10,12,18,20 G=4√10x12x18x20=4√43200≈14.42 LogG=1/4 (log10+log12+log18+log20) LogG=1/4(1.0000+1.0792+1.2553+1.3010=4.6355) Log G=1/4 (ΣlogX)=4,6355/4=1.1589 x10 G=11.589 (Açıklama: Log G yi G ye çevirmek için logG yi 10 ile çarparız. Yani G=10 log G) Örnek (frekans) X=4,5,7,9 f=1, 2, 4, 3=10 Log X=0.6021, 0.6990, 0.8451, 0.9542 f. logX=(1x0.6021)+(2x0.6990)+(4x0.8451)+(3x0.9542) =8.2431 LogG=1/ Σf .(fxlogX)= 8.2431/10=0,8243 Log G=1/10. (0.6021+1.398+3.3804+2.8626)=8.2431 Log G= (1/Σf ). (fxLog X)=8.2431/10=0.8243 G=10 x 0.8243=8.2431 Örnek (grup)2-4, 5-7, 8-10, 11-13 Sadece grupların orta noktası bulunarak yapılır. Serideki n tane birimin çarpımının n inci dereceden kökü alınarak hesaplanır. G=n√ x1.x2.x3…..xn (basit) logG=1/n(logx1+logx2+.logxn) G= Σf√X1f1 . X2f2. …Xnfn(frekans ve grup ) Log G=1/ Σf . [f1logX1 + f2logX2+ ….+log Xn] 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik HARMONİK ORTALAMA (H) Serideki birimlerin çarpmaya göre terslerinin aritmetik ortalamaya göre tersleridir. Seride 0 veya negatif bulunması durumunda H hesaplanamaz H=n/Σ(1/x) basit seri için H= Σf/ Σ(f/x) frekans ve gruplandırılmış seri için Örnek: x=10, 12, 18, 20 basit seride harmonik ortalamayı bulunuz? 1/X=1/10+1/12+1/18+1/20= 0,1000+0,0833+0,0556+0,0500=0,2889 H=n/Σ(1/x) =4/0,2889= 13,85 Örnek: frekans serisinin harmonik ortalamasını bulunuz? X=4, 5, 7, 9 f=1, 2, 4, 3=10 H= Σf/ Σ(f/x)=10/(1/4+2/5+4/7+3/9)= H=10/(02500+0,4000+0,5714+0,3333)=10/1,5547=6,43 Örnek: gruplandırılmış serinin harmonik ortalaması nedir? X=2-4, 5-7, 8-10, 11-13 f=2, 13, 4, 1=20 önce ortalamalar bulunur. X= 3, 6, 9, 12 sonra f/x ler yani 2/3,13/6,4/9,1/12 H= Σf/ Σ(f/x)=20/(0,6667+2,1667+0,4444+0,0833)=5,95 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik KARELİ ORTALAMA (K) Seriyi oluşturan gözlem değerlerinin karelerinin toplamının gözlem sayısına oranının kare köküdür. K= √∑X²/n basit seriler için K= √∑fX²/ ∑f frekans ve grup serileri için Örnek: x=10, 12, 18, 20 basit serinin kareli ortalamasını bulunuz? X²=100 +144+324+400=968 K= √∑X²/n=√968/4=15.56 Örnek: X=4, 5, 7, 9 f=1, 2, 4, 3=10 frekans serisinin kareli ortalamasını hesaplayınız? K= √∑fX²/ ∑f frekans serisi ve gruplandırılmış seri için X²= 16+25+49+81= f X²=1x16+2x25+4x49+3x81=505 K= √∑fX²/ ∑f=√505/10=7.11 Örnek: Grup=2-4, 5-7, 8-10, 11-13 f=2, 13, 4, 1=20 gruplandırılmış serinin kareli ortalamasını bulunuz? Önce orta nokta bulunur. X= 3, 6, 9, 12 sonra X² = 9, 36, 81, 144 f=2, 13, 4, 1=20 fx ² =2x9+13x36+81x4+144x1=954 K= √∑fX²/ ∑f= √954/20=6.91 27.04.2017 Selami ÖZCAN İstatistik

Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar) Duyarlı olmayan ortalamalar: seriyi oluşturan tüm gözlem değerlerinin büyüklüklerinden etkilenmeyen ortalamalardır. Medyan Mod Kantiller Kartiller Desiller Pörsentiller 27.04.2017 Selami ÖZCAN İstatistik

MEDYAN (Orta Değer, Ortanca) Büyükten küçüğe, küçükten büyüğe doğru sıraladığımızda tam ortaya düşen değer (iki değerin ortalaması) seriyi iki eşit parçaya bölen gözlem değeridir. N=toplam frekans, basit ve frekans serilerinde (N+1)/2 medyandır. Gruplandırılmış seride kaçıncı değerin medyan olduğunu bulmak için “.. den az kümülatif frekanslar bulunur. (N+1)/2 değerinin içerisinde yeraldığı kümülatif frekans gruplandırılmış seride medyan sınıfını ifade eder. Frekans ve gruplandırılmış serilerde çok sayıda değer olacağı için 1 dikkate alınmayabilir. Yani N/2 olur. N/2=medyanı gösteren değer L=medyan sınıfının alt sınırı N=toplam frekans (∑f) fm-1=medyan sınıfına kadar sınıfların frekansları toplamı fm=medyan sınıfının frekansı hm=medyan sınıfının büyüklüğü Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir. 27.04.2017 Selami ÖZCAN İstatistik

Basit seride medyana örnek tek sayı ise: ham veri: 2,2,3,7,4,5,6 basit seri: 2,2,3,4,5,6,7 (4 medyan) çift: 10, 12, 8, 4, 9, 3 sırala 3, 4, 8, 9, 10, 12 (8+9)2=8,5 medyan Örnek (çift) X N=(4+1)/2=2,5 yani 2. ve 3. değerlerin ortalaması 12+18/2=15 medyan 10 12 18 20 27.04.2017 Selami ÖZCAN İstatistik

Frekans serisinde Medyana Örnek Örnek 1: tek ise: x=2,4,6,8,10 f=2,4,3,5,1=15 15/2= 7.5 frekansa karşılık gelen X değeri medyandır. küm.f=2, 6, 9,14, 15= 7,5 değeri 6’dan büyük olduğu için frekansı 9 olan x değeri 6 medyandır. Örnek 3: çift ise X=4,5,7,9 f=1,2,4,3 küm.f=1,3,7,10 N+1/2 yani 10+1/2=5,5 değer medyandır. 5,5 değer 5 ten büyük olduğu için bir sonraki değer olan 7 nin içinde yer alır. Küm.frekansı 7 olan 7 değeri medyandır. Örnek 3: 27.04.2017 Selami ÖZCAN İstatistik

Gruplandırılmış seride medyan formülü ve notasyonları Formuldeki notasyonlar N/2=medyanı gösteren değer L=medyan sınıfının alt sınırı N=toplam frekans (∑f) fm-1=medyan sınıfına kadar sınıfların frekansları toplamı fm=medyan sınıfının frekansı hm=medyan sınıfının büyüklüğü Çok sayıda değer olacağı için sınıflama/gruplama yüzünden yaklaşık medyan değeri bulunur. 27.04.2017 Selami ÖZCAN İstatistik

Örnek 1: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz? X f küm.f. ..den az küm.f. .den çok küm.f. 2-4 2 2 2 20 5-7 13 15 15 18 8-10 4 19 19 5 11-13 1 20 20 1 =20 20/2=10 Küm.Frekans 20 15 10 5 Çözüm 2: Grafik metodu: ”..den az ve ..den çok” değerleri aynı grafikte gösterilirse x eksenindeki kesişim noktası medyandır. Çözüm 1: 10. Değer 15 frekansın içindedir. Küm frekans=15 5-7 sınıfı göstermektedir. Alt sınır:4,5 Üst sınır:7,5 büyüklüğü 3 tür. Medyan sınıfının bir önceki küm.frekansı 2, Medyan sınıfının frekansı:13 tür. Medyan:4,5+[(10-2)/13 ]x3=6,35 3 6 9 12 15 6,35 Gruplar 27.04.2017 Selami ÖZCAN İstatistik

Örnek 2: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz? X f küm.frekans 10-14 3 3 14-18 4 7 18-22 8 15 22-26 6 21 26-30 1 22 =22 22/2=11 ..den az serisinin 11. gözlem değeri 18-22 sınıfı medyan sınıfıdır. L=18, N/2=11 fm-1=7 fm=8 hm:4 Medyan: 18+ [(11-7)/8] x 4=20 medyan sınıfının içinde yer alıyor. 27.04.2017 Selami ÖZCAN İstatistik

Örnek3: Aşağıdaki dağılımın ortalama ve medyan değerini hesaplayın.

Selami ÖZCAN İstatistik Örnek 4: işletme 2. sınıf öğrencilerinin yaşlarının oluşturduğu sınıf ve frekansları aşağıdaki gibidir. Dağılımın ortalama ve medyan değerini bulunuz? 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Diğer örnekler (35+1/2=18. 20 nin içinde grup 55-57 medyan sınıfı) 54.5+{[(35/2)-14] /6}x3=56,25 medyan 27.04.2017 Selami ÖZCAN İstatistik

Sınıflandırılmış/Gruplandırılmış serinin grafikle gösterimi k.f. Grafik Metodu ile Medyan “..den az kümülatif frekans eğrisinin kesiştiği noktasındaki X değeridir. 20 Medyan değeri: 6.15 15 10 5 Gruplar 3 6 9 12 15 27.04.2017 Selami ÖZCAN İstatistik

Mod (Tepe Değer) Mod ya da tepe değer, bir seride (puan dağılımında) en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Tepe Değer (Mod) ile ilgili bazı önemli noktalar Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur. Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur.Dizinin modu 4 3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu bulunmaktadır. Bir sayı setinde elemanların hepsi birbirinden farklı ise bu basit serinin modu yoktur. Basit seriye Örnek1: 60,72,82,72,61,81,72 ise Mod=72’dir. Örnek 2: x=1,1,2,1,3,2,2,1,1,3,5,4,1,1,2 en çok tekrar edilen 1 modtur. Örnek 3: 5, 7, 12, 28, 40, 35 mod yoktur Örnek 4:10,12,18,20 mod yoktur. Frekans seriye Örnek 1: X=2,3,4,5 f=2,4,7,1 en büyük frekans 7, mod değeri ise 4 Örnek 2: x=4,5,7,9 f=1,2,4,3 frekansı (4) en yüksek x değeri 7 modtur. Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. 27.04.2017 81 81

Sınıf/Gruplandırılmış Serinin Modu Örnek 1 Mod:en büyük frekans bir gözlem değerine değil, bir sınıfa karşılık gelmektedir. Bu sınıfa mod sınıfı denir Sınıf/Gruplandırılmış Serinin Modu Örnek 1 Örnek 1: Gruplar=2-4, 5-7, 8-10, 11-13 frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 Mod: 4,5+11/(11+9) x 3= 6,15 Örnek 2: L = mod sınıfının alt sınırı ∆1= mod sınıfı frekansı ile ondan bir önceki sınıfın frekansları arasındaki mutlak fark ∆2= mod sınıfının frekansı ile ondan bir sonraki sınıfın frekansları arasındaki fark hm= sınıf aralığı, mod sınıfının sınıf büyüklüğü 27.04.2017 Selami ÖZCAN İstatistik

Örnek 1’in Grafik Metodu ile Çözümü Gruplar=2-4, 5-7, 8-10, 11-13 frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 Mod: 4,5+11/(11+9) x 3= 6,15 Frekans 15 10 5 1,5 4,5 7,5 10,5 13,5 Gruplar Mod:6,15 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Örnek 3 ve 4 Mod değerinin mod sınıfı içinde kaldığına dikkat ediniz. Birden fazla aynı değerde frekans varsa iki yada daha çok gözlem değeri veya sınıf bulunabilir. İlgili frekans serisi sınıflandırılarak , sınıflandırılmış seri ise farklı bir sınıf aralığında yeniden sınıflandırılmalıdır. Örnek 4: frekans Yeniden sınıflandırılır. 10-20 4 10-30 11 20-30 7 30-50 40 30-40 22 50-70 37 40-50 18 70-90 12 50-60 22 Toplam 100 60-70 15 Mod:30+(29/(29+3)) x 20=48,125 70-80 7 80-90 5 Toplam 100 Örnek 3: Sınıflar Frekans Küm.frekans 10-14 2 2 14-18 4 6 18-22 7 13 22-26 5 18 26-30 3 21 Toplam 21 L=18, ∆1= 7-4=3 , ∆2= 7-5=2 hm=4 27.04.2017 Selami ÖZCAN İstatistik

Ortalamalar arasındaki ilişki Simetrik Sağa eğik Sola eğik X Mod Medyan Mod Medyan X X Mod Medyan X > Medyan > Mod Mod > Medyan > X Mod=Medyan= X 27.04.2017 Selami ÖZCAN İstatistik

27.04.2017 86

Dağılımda Çarpıklık: Negatif Çarpık Dağılım Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama<Medyan<Mod. Sorular ve test kolaydır. 27.04.2017 87

Dağılımda Çarpıklık: Pozitif Çarpık Dağılım Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod<Medyan<Ortalama. Sorular ve test zordur. 27.04.2017 88

27.04.2017 89

KANTİLLER KARTİLLER, DESİLLER, PÖRSENTİLLER 1. Kartiller: büyüklük sırasına konulmuş bir seriyi 4 eşit parçaya böler.Bir seride 3 kartil bulunur. 2. kartil medyandır. Q1, Q2, Q3 ile gösterilir. Basit ve frekans serisinde kartil: Q3=3x(N+1)/4 Q1=N+1/4 Q2=2x(N+1)/4 Sınıf/gruplandırılmış serilerde kartil: Q1=L+[(N/4)-∑f/fQ1 ] x hm Q2=L+[(2.N/4)-∑f/fQ2 ] x hm Q3=L+[(3.N/4)-∑f/fQ3 ] x hm 2. Desiller =D9, D1 dir. (seriyi 10 eşit parçaya böler) Basit ve frekans serisinde desiller: D3=3x(N+1)/10 D1=N+1/10 D2=2x(N+1)/10 Grup serilerde desiller: D1=L+[(N/10)-∑f/fD1 x hm D2=L+[(2.N/10)-∑f/fD2 x hm D3=L+[(3.N/10)-∑f/fD3 x hm 3. Pörsentiller =D99-D1 dir. (seriyi 100 eşit parçaya böler) Basit ve frekans seride Pörsentiller: P3=3x(N+1)/100 P1=N+1/100 P2=2x(N+1)/100 Grup serilerde pörsentiller: D1=L+[(N/100)-∑f/fP1 x hm P2=L+[(2.N/10)-∑f/fP2 x hm P3=L+[(3.N/100)-∑f/fP3 ] x hm 27.04.2017 Selami ÖZCAN İstatistik

2. Dağılım/Değişkenlik Ölçüleri Dağılım / değişim ölçüleri Parametrik dağılım/değişim ölçüleri Değişim aralığı (Ranj) Kartil aralığı Desil aralığı Parametrik olmayan dağılım/değişim ölçüleri Ortalama sapma Varyans Standart sapma Değişim katsayısı 27.04.2017 Selami ÖZCAN İstatistik

Parametrik olmayan dağılım/değişim ölçüleri Değişim aralığı (Ranj) Kartil aralığı, yarı kartil aralığı Desil aralığı, yarı desil aralığı 27.04.2017 Selami ÖZCAN İstatistik

Değişim Aralığı (Ranj):DA En büyük ölçümle en küçük ölçüm arasındaki farktır. gruplandırılmış serilerde en yüksek sayıdan en küçük sayının çıkarılması ile bulunur. DA serinin değişkenliği hakkında zaman kaybetmeden genel bilgi verir. Dezavantajı:serideki bütün birimlerin hesaplamaya girmemesi sadece iki değerle hesaplamanın yapılması, aşırı değerlerin direkt etkisindedir. DA= Xmax-Xmin Örnek: basit seri: X=30,32,35,36,37 y=2,14,20,44,90 DA(x)=37-30=7 DA (y)=90-2=88 Örnek: Frekans serisi x:4,5,7,9 f:1,2,4,3 DA=9-4:5 Örnek: sınıflandırılmış seri: sınırlar:1-3,3-5,5-7,7-9 f=1,2,4,3 DA:9-1:8 27.04.2017 Selami ÖZCAN İstatistik

Ranj (Değişim Aralığı) Örnek Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=? Ranj (DA)= 61-59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? Ranj (DA)= 90-30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar. 27.04.2017 94

Selami ÖZCAN İstatistik Kartil (çeyrek sapma) Aralığı Desil (onda bir sapma) Aralığı Pörsentil (yüzde 1 sapma)Aralığı Kartil aralığı 3. kartilden 1. kartil çıkarılarak bulunur. En büyük ve en küçük %25 dikkate alınmadığı için Değişim Aralığına göre uç değerlerden daha az etkilenir. Dezavantajı hesaplamaya bütün değerlerin katılmaması Kartil Aralığı= Q3-Q1 dir. Yarı Kartil Aralığı=(Q3-Q1)/2 (seriyi 4 eşit parçaya böler) Desil Aralığı=D9-D1 dir. Yarı Desil Aralığı=(D9-D1)/2 (seriyi 10 eşit parçaya böler) Pörsentil Aralığı=D99-D1 dir. Yarı Pörsentil Aralığı=(D99-D1)/2 (seriyi 100 eşit parçaya böler) 27.04.2017 Selami ÖZCAN İstatistik

Kartil: Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur. 27.04.2017 96 96

25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: 15,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80,84 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y75)= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma  (65-25)/2=20 olur. 27.04.2017 97 97

Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir. 27.04.2017 98 98

Aralığın Gerçek Sınırı Örnek: Çeyrek Sapma Puan Aralığı f Toplamalı Frekans Aralığın Gerçek Sınırı 21,00-25,00 1 20,50-25,50 26,00-30,00 2 25,50-30,50 31,00-35,00 4 30,50-35,50 36,00-40,00 6 10 35,50-40,50 41,00-45,00 16 40,50-45,50 46,00-50,00 7 23 45,50-50,50 51,00-55,00 24 50,50-55,50 27.04.2017 99

27.04.2017 100 100

27.04.2017 101 101

Parametrik dağılım/değişim ölçüleri Paremetrik olmayan dağılım ölçüleri serideki bütün değişkenleri dikkate alarak ölçmesi, fakat paremetrik dağılım ölçülerinde ise serideki rakamların aritmetik ortalamadan sapmalarını dikkate alır. Ortalama sapma Varyans Standart sapma Değişim katsayısı 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Ortalama Sapma Serideki rakamların aritmetik ortalamadan farklarının toplamı sıfırdır. Ortalamadan farkların bir kısmı negatif bir kısmı pozitiftir. Toplarsan sıfır olur. Hesaplama mutlak değerlerin toplamı rakam sayısına bölündüğünde os bulunur. Formül yandaki gibidir. Medyan etrafındaki ortalama sapmanın minimum olmasıdır. Basit seride Frekans serisinde Sınıflandırılmış/gruplandırılmış seride 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Varyans Aritmetik ortalamanın özeliklerinden biri ∑(x-͞x)²=minimum olmasıdır. Fark karelerin toplamını serideki rakam sayısına böldüğümüzde varyans elde edilir. Örnek sayısı büyüdükçe n ile n-1 arasında fark kalmaz. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Standart Sapma Örnek2: 78,89,56,36,48,92,59,60=S=19.8 Standart Sapma: Ölçümlerin ortalamadan olan farklarının karelerinin ortalamasının kareköküdür. Standart sapma varyansın pozitif kareköküdür. Standart hata: Aritmetik ortalamada oluşan hatanın belirlenmesi için bulunur. Örnek1: basit seri x=1,4,5,7,9,10 ͞x=36/6=6 (x-͞x)=1-6,4-6,5-6,7-6,9-6,10-6 = -5,-2,-1,1,3,4= (x-͞x)²=25,4,1,1,9,16=56 27.04.2017 Selami ÖZCAN İstatistik

Frekans Serilerde Standart Sapma X f x.f x-͞x (x-͞x)² (x-͞x)². f 4 1 -3,25 10,5625 6 3 18 -1,25 1,5625 4,6825 7 42 -0,25 0,0625 0,375 8 32 0,75 0,5625 2,25 10 2 16 20 116 2,75 7,5625 15,125 33 Frekans serisinin ortalaması X=∑x.f / ∑f=116/16=7,25 Frekans serisinin standart sapması 27.04.2017 Selami ÖZCAN İstatistik

Gruplandırılmış seri(orta noktalar bulunur veya (kodlama metodu) Gruplar f u=kod f. u u² f . u 10-14 6 -2 -12 4 24 15-19 -1 -6 1 20-24 10 25-29 9 30-34 Toplam 40 2 18 36 75 27.04.2017 Selami ÖZCAN İstatistik

Standart sapma ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır. ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir. 27.04.2017 108

Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır: 27.04.2017 109

Standart Sapmanın Özellikleri SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. Negatif değerler almaz. Veri grubundaki tüm değerler aynı ise SS sıfırdır. SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir. 27.04.2017 27.04.2017 112 112

Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki Aritmetik ortalama ile standart sapmanın arası büyürse, Heterojen yapı oluşur ve grup başarısı düşer. Aritmetik ortalama ile standart sapmanın arası küçülürse, Homojen yapı oluşur ve grup başarısı artar. Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe, Standart sapmada büyür. Bir testten elde edilen puanların standart sapması büyüdükçe, Testin güvenirliği artar. 27.04.2017 113

Standart Hata Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. 27.04.2017 114 114

Selami ÖZCAN İstatistik Değişim Katsayısı: DK Aynı seri farklı ölçü birimleriyle farklı standart sapmaya sahip olabilir, farklı ölçü birimleriyle hesaplanan iki ayrı serinin mukayesesi de doğru değildir. Bu olumsuzlukları gidermek için değişim katsayısı geliştirilmiştir. Mutlak değişkenlik ölçüleri,seriyi oluşturan gözlem değerlerinin büyüklüklerinin de etkisi altındadır. Mutlak değişkenlik yerine nispi değişim/dağılım esas alınmıştır. Standart sapma aritmetik ortalamanın yüzdesi olarak ifade edilmiştir. DK=(s/ ͞X) x 100 Ortalaması 15, standart sapması 4,76 olan serinin DK ne olur? DK:(4,76/15) x 100=%31,73 x=10,11,13,14,17/65 (͞x=13, ss=2,7386) y=43,48,58,63,73/285 (y=57 ss=11,9373) ssx küçük ssy. DKx=2,7386/13 x 100=%21,066 DKy=11,9373/57 x100=%20,9426 X serisindeki değişkenlik y serisine göre daha fazladır. 27.04.2017 Selami ÖZCAN İstatistik

BÖLÜNMENİN ŞEKLİNE GÖRE OLUŞAN ÖLÇÜLER Şu ana kadar serilerdeki ortalama ve değişkenliği inceledik, bu yetmez. Bölünme şeklini ortaya koyan ölçülere de ihtiyaç vardır. Seriler: simetrik (X=Med=Mod) veya asimetrik (X>Med>Mod sağa çarpık seri ve X<Med<Mod sola çarpık seri) bölünür. Aritmetik ortalama ile mod veya medyan arasındaki fark pozitif ise sağa çarpık, negatif ise sola çarpık denir. Seriler: normal, sivri ve basık serilerden birine göre de bölünebilir. Bölünme şekline göre oluşan ölçüler, Momentler, Çarpıklık ve Basıklık

Bölünme şekline göre oluşan ölçüler, Momentler, Çarpıklık ve Basıklık 27.04.2017 Selami ÖZCAN İstatistik

MOMENTLER Ortalamalara (kantillere) dayanan asimetri ölçüsü yaklaşık bir değerdir. Asimetriyi daha duyarlı ölçmek için momente dayanan ölçüm yapılması gerekir. Sıfıra (x-0=xi) veya aritmetik ortalamaya (x-xort) göre sapmaların tamamına moment denir. Bir seride sıfır (aritmetik ortalama) etrafındaki r. Momente (µr.) Momenti denir. Mr=£Xʽ/n (0 için basit serinin momenti) Mr=£(X-Xort)ʽ/n (Xort için basit serinin momenti) µr=£fxʽ/£f (0 için frekans ve gruplandırılmış serinin momenti) µr= £f(x-xort)ʽ/£f (Xort için frekans ve gruplandırılmış serinin momenti) Sıfır etrafındaki 1.Moment aritmetik ortalamaya eşit, 2.momentin karekökü kareli ortalamaya eşittir. M1=0, M2=S²(varyans) µ2=M2-M²1 µ 3= M3-3M1M2+2M³1 µ 4= M4-4M1M3+6M²1M2-3M‘1 Örnek: x=10,12,18,20 serinin(0 ve xort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm: X=10, 12, 18, 20 =60/4=15 X²=100,144,324,400=968 M2=968/4=242 X3=1000,1728,5832,8000=16560 M3=16560/4=4140 X-Xort=10-15,12-15,18-15,20-15=-5,-3,3,5 (X-Xort)²=25, 9, 9, 25=68 M2=68/4=17 (X-Xort)3=-125, -27, 27, 125=0 M3=0/4=0 µ2=M2-M²1 =242-15²=17 µ 3= M3-3M1M2+2M³1 =4140-3(15).(242)+2.(15)³=0 µ 4= M4-4M1M3+6M²1M2-3M‘1

Gruplandırılmış Serinin Moment hesabı Örnek: Gruplar=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3=10 serinin (0 ve xort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm: önce sınıf orta noktaları bulunur. X=2, 4, 6, 8 f=1, 2, 4, 3 =10 Xort=58/10=5,8 X²=4,16,36,64= X³=8,64,216,512 f.X=2,8,24,24=58 f.X²=4,32,144,192=372 f.X³=8,128,864,1536=2536 (X-Xort)=(2-5,8)=-3,8 (4-5,8)=-1,8 (6-5,8)=0,2 (8-5,8)=2,2 (X-Xort)²=14,44 3,24 0,04 4,84 (X-Xort)³= -54,872 -5,832 0,008 10,648 f.(X-Xort)²=14,44 6,48 0,16 14,52 =35,60 f.(X-Xort)³=-54,872 -11,664 0,032 31,944 = - 34,560 µ2=M2-M²1 =37,2-(5,8)²=3,56 µ3= M3-3M1M2+2M³1 =253,6-3(5,8).(37,2)+2.(5,8)³=-3,456

ÇARPIKLIK (Asimetri) Bir serinin simetriden ayrılmasıdır. Rakamların dağılımı her zaman simetrik olmaz. Dağılım sağa ve sola çarpık olabilir. Serideki asimetriyi çarpıklık katsayısı ile ölçeriz. Çarpıklık katsayısı 0’a eşit olduğunda dağılım simetriktir. Çarpıklık katsayısı negatif olduğunda sola çarpık, pozitif olduğunda sağa çarpık olur. Çarpıklık katsayıları 3 e ayrılır. Pearson Çarpıklık Katsayısı Kartil Çarpklık Katsayısı Moment Çarpıklık Katsayısı

Pearson Çarpıklık Katsayısı Pearson ortalamalar arasındaki şu ilişkiyi fark etmiştir. Xort-Mod≈3(Xort-Medyan) Her iki tarafı standart sapmaya bölerek bu ifadeleri ölçü biriminden bağımsız hale getirmiştir. Çarpıklık=3(Xort-Medyan) / standart sapma Çarpıklık=(Xort-Mod) / standart sapma Not: bu katsayı sıfıra eşit ise dağılım simetrik, büyükse sağa çarpık, küçükse sola çarpıktır. X=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3 kf=1, 3, 7, 10 Medyana dayalı çarpıklık için aritmetik ortalama ve standart sapmayı bilmek gerekir. Aritmetik ortalama:5,8 2.Moment ise 3,56 (varyanstır) Standart sapma=√3,56≈1,89 N=10 10/2=5. değer medyandır. Medyan 5-7 sınıfı Yaklaşık medyan değeri=5+[(5-3)/4].2=6 dır. Medyana dayalı çarpıklık= 3(xort-medyan)/standart sapma Medyana dayalı çarpıklık= 3(5,8-6)/1,89 ≈-0,32 Mod=L1+[∆1/ (∆1+ ∆2)].c =5+[2/(2+1)]2=6,33 Moda dayalı çarpıklık= =(Xort-Mod) / standart sapma= Moda dayalı çarpıklık 5,8-6,33 / 1,89= -0,28 Seri sola çarpıktır.

Kartil Çarpıklık Katsayısı Herhangi bir dağılıma ait kartil değerleriyle de asimetrik dağılım olup olmadığına karar verilebilir. Kç=(K3-K2)-(K2-K1) / K3-K1 Kç=(K3-2K2)+K1 / K3-K1 Örnek: (pearsen örneğinin devamı) medyan 6, medyan 2. kartile eşittir.1. ve 3. kartili tespit etmek gerekir. Sonra çarpıklığa bakılır. K1 için N/4 10/4=2,5 değer 1.kartildir. Kümülatif frekansı 3 olan 3-5 sınıfı 1.kartil sınıfıdır. K3 için 3N/4=3x10/4=7,5 değerdir. Sınıfı 7-9 sınıfıdır. K1=3+ [(2,5-1)/2].2=4,5 K3=7+[(7,5-7)/3].2=7,33 Buna göre Kartil çarpıklık katsayısı şu şekilde bulunur. Kç=(K3-2K2)+K1 / K3-K1 Kç=(7,33-2x6+4,5) / (7,33-4,5) =-0,06 Negatif çıktığı için seri sola çarpık demektir.

Moment Çarpıklık Katsayısı Ortalama etrafındaki 3. momentin standart sapmanın 3. kuvvetine bölünmesiyle elde edilir. α3=µ3 /s³ Simetrik dağılımlarda moment çarpıklık katsayısı 0 dır. α3>0 ise sağa çarpık, α3<0 ise sola çarpıktır. Örnek1: 2.moment 17 ve 3. moment 0 dır. Aritmetik ortalama etrafındaki 2. moment, varyans ve bunun karekökü de standart sapmaya eşittir. Standart sapma=4,12 Bu dağılıma ait moment çarpıklık katsayısı=0/(4,12)³=0 Sonuç, katsayı 0 olduğu için dağılım simetriktir. Örnek 2= aritmetik ortalama etrafındaki 2. moment 3,56 (varyans)(standart sapma varyansın karekökü yani 1,89) ve 3.moment -3,456 ise moment çarpıklık katsayısı nedir? α3=µ3 /s³=-3,456/(1,89)³=-0,51 (sola çarpıktır.)

BASIKLIK (momente dayanan basıklık ölçüsü) Örnek1: X=10,12,18,20 =60/4=15 (basit) Çözüm: (X-Xort)=-5, -3, 3, 5 (X-Xort)4=625, 81, 81, 625=1412 ά4 = µ4/S4 =>µ4 =1412/4=353 S4=(17)²=144 ά4 =353/144=1,22 < 3 ten küçük olduğu için dağılım normale göre basıktır. Örnek2: X=2,4,6,8 f=1,2,4,3 =10 (frekans) Çözüm: (X-Xort)= -3,8 -1,8 0,2 2,2 (X-Xort)4=208,5136 10,4976 0,0016 23,4256 f . (X-Xort)4=208,5136 20,9952 0,0064 70,2768 =299,7920 µ4 =299,792/10=29,9792 S4=(3,56)²=12,6736 ά4 =29,9792/12,6736=2,37 < 3 olduğundan seri normale göre basıktır. Yani dağılımın değişkenliği normal dağılımın değişkenliğine göre fazladır. Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir. ά4 =3 olursa yükseklik normal ά4 ≥3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά4 ≤3 dağılım basıktır(dağılımda değişkenlik fazla). S4=(µ2)² Ör: bir önceki örnekte aritmetik ortalama etrafındaki 2. moment µ2=17 ve µ2=3,56 olarak hesaplanmıştı önce aritmetik ortalama etrafındaki 4. momenti bulunuz. Sonra moment basıklık katsayısını bulunuz.

Selami ÖZCAN İstatistik BASIKLIK Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir.ά4 =3 olursa yükseklik normal ά4 ≥3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά4 ≤3 dağılım basıktır(dağılımda değişkenlik fazla). Ör: 27.04.2017 Selami ÖZCAN İstatistik

Çarpıklık Katsayısı Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir. 27.04.2017 126

Dağılımın Basıklığı

Selami ÖZCAN İstatistik DÖRDÜNCÜ BÖLÜM İHTİMAL HESABI 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik 4. BÖLÜM: Sunum planı Deney, sonuç ve örneklem uzay Olasılık (ihtimal) Olasılık(ihtimal) Hesaplama Sayma ve Ayrılık olayları Çarpma Kuralı Toplama Kuralı Beklenen değer (matematik ümit) Bazı kurallar 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik GİRİŞ Meteroroloji uzmanı: %80 ihtimalle yağmur yağacağını Sağlık uzmanı sigara içenlerin içmeyenlere oranla daha çabuk kansere yakalanacağını İhtimal tahlil edici, çıkarımsal istatistiktir. Satış tahminleri 27.04.2017 Selami ÖZCAN İstatistik

DENEY, SONUÇ VE ÖRENLEM UZAY Deney: pek çok gözlemden sadece bir tanesinin gerçekleşmesi sürecine deney denir. Deneyin sonuçları: bu gözlemlere deneyin sonuçları denir. Örneklem uzay: bu sonuçların tümüne ise deneyin örneklem uzayı denir. Örneklem uzay S ile gösterilir. s= (hatalı, hatasız) Örneklem noktaları: örneklem uzayın elemanlarına örneklem noktaları denir. Deney Sonuç Örneklem uzay Vida inceleme Hatalı / hatasız S=(hatalı, hatasız) Paranın bir kez atılması Yazı tura S=(yazı, tura) Paranın iki kez atılması YY,YT,TT, TY S=(YY,YT,TT,TY) Zarın bir kez atılması 1,2,3,4,5,6 S=(1,2,3,4,5,6) Doğacak bebeğin cinsiyeti Erkek, kız S=(kız, erkek) Öğrencinin yarıyıl sonuçu Başarılı, başarısız S=(başarılı, başarısız) 27.04.2017 Selami ÖZCAN İstatistik

Örneklem Uzay/ örnek uzayı s=(Y,T) Venn Şeması: bir deneyin tüm muhtemel sonuçlarının kare, dikdörtgen veya daire ile gösterilmesine denir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) venn şeması ile gösterilmesi Ağaç diyagramı: her bir sonucun ağacın bir dalı ile ifade edilmesidir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) ağaç diyagramı ile gösterilmesi Nihai Sonuçlar Y Yazı Y. T. Tura T 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik BASİT VE BİLEŞİK OLAY Olay: bir deneyin bir veya daha çok sonucundan oluşur. Olay basit (elementer) ve bileşik (katışık) olay şeklinde gerçekleşmektedir. Basit olay: herhangi bir deneyin nihai sonuçlarına denir. Basit olay sadece ve sadece bir tane sonuç içermekte Ei biçiminde gösterilir. Örnek: bir işyerinde çalışan personel arasında rastgele iki tanesinin seçildiği ve cinsiyetlerinin(erkek, kadın) kaydedildiği düşünülsün bu deneyin tüm sonuçları: E1(EE), E2(KE), E3(EK), E4(KK) bu dört durumdan her biri basit olaydır. Yarın yağmur yağması ihtimali, tek sonuç Sınıfta gözlüklü öğrenci olması ihtimali tek sonuç Bileşik (katışık) olay: iki veya daha fazla sonucun yani birden çok sonuçtan oluşmaktadır. A1, A2, A3,… veya B1, B2, B3, B4, B5,….Bn şeklinde gösterilir. Birarada meydana gelen,birbirini engelleyen olaylr Örnek1: bir işyerinde çalışan personel arasında rastgele iki tanesinin seçildiği ve cinsiyetlerinin(erkek, kadın) kaydedildiği düşünülsün bu A olayının en çok bir erkeğin seçilmiş olduğunu venn şemasında gösteriniz? Bileşik olay: iki durum: istenen en çok bir erkek olması: EK, KE, KK, ikinci durum istenmeyen: EE Örnek2: bir grup insan kainatın yaratıcısına inanıyor ve yaratıcıyı kabul ediyor, geri kalanı inanmamakta ve karşı çıkmaktadır. Bu gruptan rastgele iki kişi seçilmiş ve kainatın yaratıcısı hakkında görüşleri sorulmuş. Kaç farklı sonuç söz konusudur. En çok bir kişinin inanmıyor olma durumu nedir. İ:inanıyor, K:karşı çıkıyor/inanmıyor İİ: her ikisi de inanıyor. KK: her ikisi de inanmıyor. İK: biri inanıyor, biri inanmıyor.Kİ:biri inanmıyor, biri inanıyor. 4 farklı durum söz konusudur, birden çok sonuç var. Bileşik olaydır. İİ, İK, Kİ üç durum söz konusudur. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Basit ve bileşik olay örneklerinin Venn şeması ve Ağaç diyagramı gösterimi EE. A EK. İİ İ KE. KK. İK K İ Kİ İ K İİ. İK. Kİ. KK. K KK A B A∩B AUB 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik İhtimal Hesaplama İhtimal/Olasılık (Probability): bir olayın meydana gelme sansının sayısal ölçüsüdür. N birim ihtiva eden ana kütleden belli bir x özelliğini taşıyan n tane birim varsa bu ana kütleden rastgele bir birim alındığında bu birimin x özelliğini taşıması durumudur. P(x)=n/N şeklinde hesaplanır. Ei ile basit olayın ihtimali (P(Ei)dir. A ile bileşik olayı ihtimalı P(A) ile gösterilir. İhtimal (Olasılık) İki Temel Özelliği 1. Bir olayı meydana gelmesi ihtimali 0 ile 1 arasında değişir. Olay ister basit, ister bileşik olsun ihtimali sıfırdan küçük birden büyük olamaz. 0≤P(Ei) ≤1 0≤P(A) ≤1 P(x)=n/N=0 ise söz konusu olayın meydana gelmesi (imkansız=olanaksız) mümkün değildir. 1 olması olayın kesinlikle (yani %100) (mümkün=kesin) meydana geleceğini ifade eder.P(İ)=0 imkansız P(M)=1 mümkün olay içindir. Sıfıra yakın ihtimal zayıf bire yakın ihtimal kuvvetli 2. Bir olayın mümkün bütün hallerinin ihtimal toplamı 1 e eşittir. ∑P(Ei)= p(E1)+p(E2)+p(E3)+p(E4) ….=1 Bir olayın meydana gelme (p) ve gelmeme(q) ihtimalleri toplamı1 dir. p+q=1 bu tür ihtimallere birbirini tamamlayan ihtimaller denir. 1-p=q Paranın bir kez atlılması: P(Y)+P(T)=1 (belki dik gelebilir) iki kez atılması: P(YY)+P(YT)+P(TY)+P(TT)=1 Bir maç sonucu: P1(galibiyet)+P2(mağlubiyet)+P3(beraberlik)=1 27.04.2017 Selami ÖZCAN İstatistik

İhtimale 3 yaklaşım (klasik, nispi, öznel) Sonuçların ortaya çıkma ihtimalleri eşit ise klasik yaklaşım Bir deneydeki basit olayın ihtimali 1 in tüm sonuç sayısına bölünmesine eşittir. P(Ei)=1/toplam sonuç sayısı P(A)= A olayında içerilen sonuç sayısı / toplam sonuç sayısı Paranın bir kez atılmasında yazı ihtimali P(Y):1/2=0,5 tura ihtimali P(T):1/2:0,5 Zarın bir kez atılmasında çift sayı gelmesi ihtimali P(A)= 2,4,6/1,2,3,4,5,6=3/6=0,5 Bir derneğin 100 üyesi(60 erkek, 40 kadın) var. Dernek başkanının kadın olma ihtimali nedir? 40/100=0,4 Öznel yaklaşım: ne sonuçlar eşit, ne de veri üretmek için tekrarlanabilen deneylerle karşılaşılabilir. Bir olay için sübjektif değer yargısına, tecrübe, bilgi ve düşünceye dayalı ihtimaldir. Göreli (Nispi) sıklık yaklaşımı: ortaya çıkma ihtimalleri eşit değil, mesela; rastgele seçilen bir ailenin yıllık geliri 10.000 TL den büyük olma ihtimali, civalı bir zarın atılması durumu, hileli paranın atılması durumu, 80 yaşındaki birinin bir sene sonra ölme ihtimali Yaklaşık ihtimal için göreli sıklık: bir deney n kez tekrarlanmış ve f kez bir A olayı gözlenmiş ise P(A)=f/n dir. Ör: rastgele 500 ürün seçilmiş bunlardan 10 tanesinin hatalı olma ihtimali nedir? 10/500=0,02 ilk üretilen ürünün hatalı olması, hatasız olma ihtimali ise:0,98 yaklaşık ihtimal söz konusu, gerçek ihtimal değil. Deney sonsuz(çok) kez tekrarlanırsa gerçek ihtimale yaklaşır.Buna Büyük sayılar Yasası denir. Ör: Ankara’dan rastgele seçilmiş bir ailenin ev sahibi olma ihtimali nedir? Ankara’da ikamet edenlerin ne kadarı ev sahibi bilinmiyor. Eşit değil Rastgele 1000 aile seçiliyor, 670 ev sahibi 330 değil P(A)=f/n 670/1000=0,670 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Sayma Kuralı Sonuç sayısı az iken listelemekte sorun yok idi, fakat çok sayıda sonucu listelemek zor. Çok sayıda sonuç için sayma kuralı geçerlidir. Aynı anda vuku bulmaları imkansız olan birbirinden farklı k adet olay n defa tekrarlanırsa örnek: bir para 10 kez atılıyor sonuç: 2x2x2x2x2x2x2x2x2x2= =1024 İlk denemede k1, 2. denemede k2, n. Denmede kn dir. k1 x k2 x k3x..kn ör. 4 çeşit salata, 10 çeşit çorba, 3 çeşit meşrubat ve 6 çeşit tatlı var. Mümkün sonuç:4x10x3x6=720 Ör. bir deneyde ilk aşamada r tane, 2. aşamada n tane, 3. aşamada k tane sonuç olmak üzere 3 aşama bulunuyorsa bu deneyin toplam sonuç sayısı: r.n.k dır. Sonuç sayısının 3 ten az veya çok olması sayma kuralı için fark etmez. Bir para üç kez atılıyor. Her atılmada 2 durum(Y,T) vardır. 2x2x2=8 sonuç var. yyy, yyt, yty, ytt, tyy, tyt, tty, ttt Bir otomobil fabrikası 2 durum (sabit ve değişken faiz oranları) ile 36, 48 ve 60 ay vade yapmaktadır. Kaç farklı satış olur?2x3=6 sonuç Süper ligte 16 maç yapılmakta her maçın 3 durumu (galibiyet, mağlubiyet, beraberlik) söz konusu her takım için toplam sonuç sayısı nedir? 3x3x3x3x3x3x3x3x3x3x3x3x3x3x3x3= = 43.046.721 kn 210 316 27.04.2017 Selami ÖZCAN İstatistik

Bileşen (Marjinal) ve Şartlı (bileşik) İhtimaller Cinsiyet Onaylıyor (A) Onaylamıyor (B) Toplam Erkek (E) 15 45 60 Kadın (K) 4 36 40 19 81 100 Herhangi bir başka olay dikkate alınmaksızın sadece bir olaya ilişkin ihtimale Bileşen (basit) ihtimal denir Bir olayın oluştuğunun bilinmesi durumunda diğer olayın meydana gelme ihtimaline şartlı (bileşik) ihtimal denir. Örnek: Çalışanların cevaplarına ilişkin iki yönlü sınıflama: 100 kişiye üst seviye yöneticilere çok yüksek ücret ödenmesi sorulmuş erkek (60) 15 onaylıyor 45 onaylamıyor; kadın (40) 4 onaylıyor, 36 onaylamıyor. P(E)=erkeklerin sayısı/tüm çalışanların sayısı=60/100=0,6 P(K)=kadınların sayısı/tüm çalışanların sayısı=40/100=0,4 P(A)=19/100=0,19 P(B)=81/100=0,81 Şartlı (Bileşik) ihtimalli iki yönlü sınıflama P(EA)=ihtimali hesaplanacak olay/gerçekleşmiş olay 15/60=0,25 (seçilen kişinin yüksek ücreti onaylayan ve erkek olma ihtimali 0,25 tir. Erkek onaylıyor 15/19 Onaylıyor Kadın onaylıyor 4/19 Verilen olay Erkek onaylamıyor 45/81 Onaylamıyor 36/81 27.04.2017 Kadın onaylamıyor Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Ayrık Olay, Ayrık Olmayan Olay Birlikte ortaya çıkmayan olaylara denir. Birlikte olamayan olaylara karşılıklı ayrık olaylar denir. Bu tür olayların ortak sonuçları bulunmamaktadır. Şayet iki ve daha fazla olay ayrık ise deneyin her tekrarında bu olaylardan en çok bir tanesi ortaya çıkmaktadır. Bir olayın ortaya çıkması, diğer olay ya da olayların ortaya çıkmasını dışta tutma. İki ayrık olayların ihtimalleri veya varsa olayların ihtimali toplanır. Deneyin herhangi bir tekrarında ortaya çıkacak sadece bir sonuç olduğu için nihai sonuçlar her zaman ayrıktır. Örnek:Zarın bir kez atılmasında a=çift b=tek c=5 ten küçük olması ihtimali=1,2,3,4 sayı 4/6= 0, 66 a ve b olayları ayrık fakat a ve c ayrık olmayan P(a, b)= 3/6 +3/6 =1(ayrık) P (a, c)=2,4 yani 2/6 ayrık değil Ör: hilesiz bir zar atıldığında 1 veya 5 gelme ihtimali P (1 veya 5)=1/6 +1/6=2/6=1/3 Ör: 8 kırmızı,5 sarı, 4 beyaz, 2 yeşil çekilen topun sarı veya beyaz olma ihtimali? İlk çekilen geri konuyor. 5/19+4/19=9/19=0,47 b a c a 3 5 2 4 6 1. 3. 2. 6. 4. 5. 27.04.2017 Selami ÖZCAN İstatistik

Bağımlı/Bağımsız Olay Bağımsız Olay: şayet bir olayın ortaya çıkması öteki olayın ortaya çıkma ihtimalini etkilemiyorsa bu iki olaya bağımsız olaylar denir. P(A/B)=P(A) veya P(B/A)=P(B) şartı yerine getirilmelidir. Bağımlı olaylar: bir olayın ortaya çıkması, diğer olayın ortaya çıkma ihtimalini etkiliyorsa bu olaya bağımsız olmayan veya bağımlı olay P(A/B) ≠ P(A) veya P(B/A) ≠ P(B) Örnek: 100 kaset (15 i bozuk), 60 ı 1.makinede (9 u bozuk), 40 ı 2.makinede (6 sı bozuk) üretilmiştir. Rastgele seçilen bir kasetin bozuk olma ihtimali nedir? D:rastgele seçilen kasetin bozuk olma iht. A:bu kasetin 1. makinede üretilmiş olma iht. P(D)=15/100=0,15 P(D/A)=9/60= 0,15 eşit çıktı bu iki olay (D ve A) bağımsız olaydır. Ayrık olaylar her zaman bağımlıdır. Bağımlı olaylar her zaman ayrık olmayabilir. 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik A ͞A TAMAMLAYICI OLAY İki ayrık olayın bir deneyin tüm sonuçlarını içeriyorsa bu iki olay birbirinin tamamlayıcısıdır. Tamamlayıcı olaylar her zaman ayrık olaylardır. P(A) + P(͞A) =1 dir. Örnek: 5 makinenin 2si bozuk,rastgele seçilenin bozuk olma ihtimali nedir? A:seçilen makine bozuk, ͞A:seçilen makine sağlam P(A)=2/5:0,40 P(͞A):3/5:0,60 Örnek: zarın bir kez atılması olayında 4’ten büyük çıkma (5,6) ihtimali nedir? P(A)=2/6=0,33P(͞A)=4/6=0,67 veya 1-0,33=0,67 27.04.2017 Selami ÖZCAN İstatistik

OLAYLARIN ARA KESİTİ ve ÇARPMA KURALI B OLAYLARIN ARA KESİTİ ve ÇARPMA KURALI Çarpma kuralı: bileşik ihtimal AnB veya AB P(A ve B)=P(A) x P(B) İki olay 1.olayın bileşen ihtimali 2.olayın şartlı ihtimali Tamam Red Toplam Erkek 7 20 27 Kadın 4 9 13 11 29 40 P(E) ve P(T) P(EveT)=P(E) x P(T/E) (27/40)x(7/27)=7/40=0,175 Erkek ve tamam Ör: 20 kaset 4 ü bozuk, 2 tane seçiliyor seçilen 2 kasetinde bozuk olma ihtimali (iadesiz çekiliş) S1: ilk seçilen kasetin sağlam olma iht.16/20 B1: ilk seçilen kasetin bozuk olma iht. 4/20 S2: ikinci seçilen kasetin sağlam olma iht.15/19 B2: ikinci seçilen kasetin bozuk olma iht.3/19 P(B1 ve B2)=P(B1) x P(B2/B1)=4/20 x 3/19=0,032 27.04.2017 Selami ÖZCAN İstatistik

BAĞIMSIZ OLAYLAR ÇARPMA KURALI A ve B gibi bağımsız 2 olayın bileşik ihtimali P(A ve B)= P(A) x P(B) Örnek. 2 adet yangın tüpü var herhangi birinin çalışmama ihtimali 0,02 yangın anında her ikisinin de çalışmama ihtimali nedir? P(1 ve 2)= P(1) x P(2) = 0,02x0,02=0,004 Ayrık olayların bileşik ihtimali İki ayrık olayın bileşik ihtimali her zaman 0 dır.P(A ve B)=0 Örnek: iş başvurusu kabul ve red, kabul ve reddin bileşik ihtimali 0 dır. 27.04.2017 Selami ÖZCAN İstatistik

OLAYLARIN BİLEŞİMİ VE TOPLAMA KURALI AuB P(A veya B)=P(A)+P(B)-P(AveB) OLAYLARIN BİLEŞİMİ VE TOPLAMA KURALI Örnek: Erkek 45 kabul, 15 red, 10 çekimser; Kadın 80 kabul 110 red, 30 çekimserdir. Erkek ve red olma ihtimali: 70/300:0,233 125/300:0,416 P(E/R)= 0,233x0,214=0,04499 P(E ve R):P(E)+P(R)-P(E/R) 0,233 + 0,416 – 0,04499=0,6 Ayrık olaylarda toplama kuralı P(A veya B)=P(A) + P(B) Toplama kuralı (yandaki örneğe göre) P (red veya çekimser) olma ihtimali nedir? 125/300+40/300=0,416+0,133 =0,563 27.04.2017 Selami ÖZCAN İstatistik

5. BÖLÜM: Kesikli Rassal Değişkenler Kesikli İhtimal Dağılımları Rassal Değişken: bir deney/gözlemin şansa bağlı sonucunda bir değişkenin aldığı değere (ihtimal ve istatistikte) rassal değişken adı verilir. Kesikli Rassal Değişken: yalnız belirli tamsayı değerleri alabilen, birbirini izleyen değerler arasında belirli boşluklar (sayımla elde edilen değerler) varsa kesikli rassal değişken sayılabilir. Ör.Satılan otomobil sayısı, bilet sayısı, izleyici sayısı, elbise sayısı, çocuk sayısı vb. Sürekli Rassal Değişken: ölçüm/tartımla elde edilen değerler, iki değer arasına sonsuz sayıda değer sıkıştırılabilen değişken sürekli rassal değişkendir. Ör. Boy uzunluğu, bir sorunun çözülme süresi, ağırlık, bir evin değeri(fiyatı) vb. Kesikli rassal değişkenin ihtimal dağılımına örnek Oto sayısı:0,1,2,3,4 Frekans(sıklık):30,470,850,490,160=2000 Nisbi frekans: 0,015;0,235;0,425;0,245;0,080=1 Kümülatif nisbi frekans:0,015;0,25;0,675;0,92;1 İhtimal dağılımı P(X):0,015;0,235;0,425;0,245;0,080=1 P(x) değerleri , X değerlerinin ihtimal dağılımını oluşturur P(2)=0,425 tir. 0≤P(X)≤1 ve ∑P(X)=1 0,5 0, 425 0,4 0,3 0,245 0,235 0,2 0,1 0,080 0,015 0,0 0 1 2 3 4 X 27.04.2017 Selami ÖZCAN İstatistik

Kesikli bir Değişkenin Ortalaması ve Standart Sapması Kesikli Değişkenin Ortalaması Beklenen Değer (Matematik Ümit) E(x)=µ=∑x P(X)= n x P(X) X kesikli değişken, n adet denemede X1 olayı P1 ihtimalle, Xn olayı Pn ihtimalle meydana geliyorsa X1 in beklenen değeri E(x=1)=n.P1 Ör:3 er birimlik 1000 paket mal satın alınmakta kusur sayılarına ilişkin ihtimal tablosu aşağıda beklenen değeri bulunuz E(x=0)=n.P0=0x0,512=0 E(x=1)=n.P1=1x0,384=0,384 E(x=2)=n.P2=2x0,096=0,192 E(x=3)=n.P3=3x0,008=0,024 µ=∑x P(X)=0,6 Kesikli Değişkenin Standart Sapması Ó=Standart sapma ss’nın büyük olması x değerlerinin ortalama etrafında geniş bir aralıkta değerler aldığını, SS küçük olması dar aralıkta dağıldığını gösterir. Gözlenen değerlerin ortalamaya yakın dağıldığını gösterir İstatistiksel değerlendirmelerde standart sapmanın karesi alınarak bulunan ve sigma kare ile varyans değeri hesaplanır Ör: x arızalı parça, 400 parça sevkiyatın ihtimal dağılımı tabloda var. Ortalama ve standart sapmayı bulunuz? Yorum: 400 parça sevkiyatın 1,2 standart sapma değeri ile 2,5 tanesi arızalıdır. X 1 2 3 4 5 Top. P(X) 0,02 0,20 0,30 0,10 0,08 X P(X)=µ 0,00 0,60 0,90 0,40 2,50 X 2 9 16 25 55 X 2 P(X)=sigma 1,20 2,70 1,60 2,00 7,70 X 1 2 3 Top P(X) 0,512 0,384 0,096 0,008 27.04.2017 Selami ÖZCAN İstatistik

Kesikli Dağılımın Beklenen Ümit ve Varyansı Örnek:Bir zar atılıyor. Anlaşmaya göre Ali babasından her atışta kaç gelirse o kadar TL para alacaktır. Atış başına Ali nin beklediği parayı bulunuz. X= x f(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 1 Örnek: Bir kitaptaki bir sayfadaki yanlış sayısı ile ilgili X’in olasılık fonksiyonu şöyledir: P(x=0)=0.81 hiç yanlış olmaması P(x=1)=0.17 bir yanlış olması P(x=2)=0.02 iki yanlış olması Sayfa başına ortalama yanlış sayısını bulunuz. Sayfa başı ortalama 0.21 yanlış bulunur. Ali’nin atış başına ortalama kazancı 27.04.2017 Selami ÖZCAN İstatistik

Faktöriyeller ve Kombinasyonlar Faktöriyeller ! 1’e kadar tüm pozitif sayıların çarpımından oluşur. Kural 1!=1, 0!=1 Sıra önemli olduğunda n adet olay n!=n(n-1) ör.6 kitap 6!=6x5x4x3x2x1=720 Sıra önemli olduğunda n adet olaydan x adeti n!/(n-x)! (permutasyon) 6 kitap 4lü şekilde kaç farklı şekilde dizilir. 6!/(6-4)! =360 Kombinasyonlar (C) Sıra önemli olmadığında n adet olaydan x adedinin seçilme yollarının sayısını vermektedir. n=toplam eleman sayısını x= her seferinde seçilecek eleman sayısı Not:n değeri x ten büyük en fazla eşit olmalı Örnek. 6!/4! (6-4)! =15 Ör. 20 öğretim üyesinden 5 tanesi rastgele proje için seçilecek, kaç farklı seçim olur 20!/5! (20-5)! =15.504 27.04.2017 Selami ÖZCAN İstatistik

ÖNEMLİ BAZI KESİKLİ DAĞILIMLAR Üniform Dağılımı Bernoulli Dağılımı Binom Dağılımı-Poisson a Yaklaşımı Poisson Dağılımı-Binom a yaklaşımı Geometrik Dağılım Hipergeometrik Dağılım Pascal (Negatif Binom) Dağılımı 27.04.2017 Selami ÖZCAN İstatistik

1. Üniform Dağılımı Kesikli bir şans değişkeni tanımlı olduğu tüm noktalarda eşit olasılık değerine sahip ise bir başka ifadeyle tanımlı olduğu değerlerin hepsinde olasılık fonksiyonun aldığı değer sabit ise bu kesikli şans değişkeni üniform dağılımına uygundur. Üniform dağılımı gösteren bir şans değişkeni k farklı noktada tanımlı ise olasılık dağılımı; şeklinde ifade edilir.

Üniform Dağılımının Beklenen Değer ve Varyansı =

Örnek: Hilesiz bir zar atıldığında X şans değişkeni ortaya çıkabilecek farklı durum sayısını ifade ettiğine göre X’in olasılık dağılımını oluşturarak beklenen değerini ve varyansını bulunuz. Çözüm S = { x / 1,2,3,4,5,6 } Ortaya çıkan olaylar eşit olasılıklı olaylar x şans değişkeninin dağılımı k = 6 olan kesikli üniform dağılımına uygundur.

Selami ÖZCAN İstatistik 2. BERNOULLİ DAĞILIMI Bir şans değişkeninin bernoulli dağılımı göstermesi için ilgilenilen süreçte bernoulli deneyinin varsayımlarının sağlanması gereklidir. Bernoulli Deneyinin Varsayımları: - Deneyler aynı koşullarda tekrarlanabilirlik özelliğine sahip olmalıdır. - Deneylerin yalnız iki mümkün sonucu olması gereklidir. - Başarı olasılığı (p),deneyden deneye değişmemektedir (Başarısızlık olasılığı q = 1-p ile gösterilir) - Denemeler birbirinden bağımsız olmalıdır. İki sonucu olan durum Başarılı başarısız Başarı 1 ve başarısızlık 0 Başarılı ihtimali p(x) Başarısızlık ihtimali q(x) veya 1-p p(X=x)= p(x=1) ve 1-p (x=0) P(X=x)= p² x (1-p)ª-³, x=0,1 beklenen değer: µ=E(x)=P dir Standart sapma (σ)=√p.(1-p) Ortalaması µ=∑x . P(x) 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik ÖRNEKLER 1: Hilesiz bir para atılıyor. X=tura A=(T) S=(T,Y) T gelmesi başarı yani 1 dir. nA=1 ve n=2 p=P(X=1)=P(A)=nA/n = ½ 1-p=P(x=0)=1-p(x=1)=1/2 Benoulli dağılımı ½ dir. 0,5 tir. X rassal değişkenin ihtimal dağılımı P(X=x)= ½ x=0 ve ½ x=1 P(X=x)=(½)x (½)1-x x=0,1 olarak elde edilir. 2:Hilesiz iki zar atılıyor.Başarı ikisininde 6,6 gelmesi x=1 Başarısızlık ikisininde 6,6 gelmemesi x=0 A=(6,6) ve nA=1 p=P(x=1)= P(A)= nA/n=1/6 iki tane olunca 1/6x1/6=1/36 1-p=P(x=0)= 1-P(x=1)= 35/36 dır. P(X=x) (1/36)x . (35/36)1-x x=0,1 3: 100 kalemden 97 kusursuz. Rastgele seçilen bir kalemin kusursuz olma başarı (x=1) ihtimali Kusurlu olma başarısız (x=0) ihtimali nA=97 n=100 97/100=0,97 kusursuz iht. 1-0,97=0,03 kusurlu olma ihtimali P(X=x)=(0,97)x . (0,03)1-x x=0,1 27.04.2017 Selami ÖZCAN İstatistik

Örnek: Bir deste iskambilden çekilen bir kağıdın as olup olmaması ile ilgileniyor. As gelmesi başarı olarak ifade edildiği durum için olasılık fonksiyonunu oluşturunuz. x = 0 (as gelmemesi) x = 1 ( as gelmesi) S = { x / 0,1 } P( X = 0 ) = 48 / 52 P( X = 1 ) = 4 / 52

3. BİNOM (İKİ DURUM) İHTİMAL DAĞILIMI n:tekrarlı bir deneyde (toplam deneme sayısı), x kez istenen (başarı) sonuç gelmesi durumunda ihtimallerin bulunması için P(X) başarılı sonuç elde etme ihtimali X değişkeninin iki sonuçlu (kesikli) bir değişken olması gerek. Deneyin her tekrarından sonra bu iki sonuçtan birinin ortaya çıkması gerekir. Kız,erkek; yazı tura; başarılı, başarısız; hatalı hatasız; iki sonuçlu olaylar binom dağılımı ile çözülür. p=1-q X değerleri 0,1,2,3 … gibi kesikli değerler ve bu değerler için nokta ihtimalleri hesaplandığından binom dağılımı kesikli ihtimal dağılımıdır. P=0,5 binom dağılımı simetriktir. P<0,5 sağa; 0,5<p ise sola çarpık Ortalama=n.p varyans=np(1-p) standart sapma=√np(1-p)=√npq Moment çarpıklıkά3=(1-p) / √npq, moment basıklıkά4=3+(1-6p)q / npq Binom Dağılımının Özellikleri Deney n kez aynı şartlarda tekrarlanmalı Sadece iki sonucu olmalı İki sonucun ihtimali her deneme için aynı ve bire eşittir. Denemeler bağımsız, bir denemenin sonucu diğer denemenin sonucunu etkilememektedir. 27.04.2017 Selami ÖZCAN İstatistik

Binom Dağılımına Örnek 0!=1 Bir sayının 0. kuvveti 1 dir. Binom Dağılımına Örnek %15 kusurlu şansa bağlı alınan 3 örneğin en az iki mamulün kusurlu olma ihtimali nedir? Çözüm: P(x≥2)= P(x=2) + p(x=3) (3/2)0,15x0,15x0,85+(3/3)0,15x0,15x0,15x0,85.sıfırıncı kuvveti =0,0574+0,0034=0,0608 %6,08 Örnek: %10 hatalı, 4 birimlik mamulun en çok 2 sinin hatalı olma ihtimali nedir? Çözüm: n=4 P(x≤2)=P(x=0)+P(x=1)+p(x=2) =0,6561+0,2916+0,0486=0,9963=%99,63 Ör. Bir fabrikada üretilen tv lerin arızalı olma ihtimali %5 tir. 3 tv seçtiğimizde 1.nin arızalı olma ihtimali (binom) nedir? Çözüm: 0,1354=%13,54 yanda çözümü Örnek:Kargo şirketi paketlerinden %2 si zamanında ulaşmıyor. Bir müşteri 10 paket veriyor. 1 tanesinin zamanında ulaşmama ihtimali? (10/1) 10x(0,02)1x(0,98)9=0,1667 En çok 1 tanesinin zamanında ulaşmama ihtimali?p(x=0)+p(x=1)=0,9838 Binom Dağılımının Ortalama(np) ve Standart Sapması(√npq) Ör:Bir şehirde yaşayanların oyların %58 i A partisi almış, bu şehirden 25 kişi seçildiğinde X’in(A partisine oy verenlerin) ihtimal dağılımının ortalaması ve standart sapması nedir? Ortalama:25x0,58=14,5 Standart sapma:√25x0,58x0,42:2,47 Yorum: seçilen 25 kişiden 2,47 standart sapmayla ortalama 14,5 kişinin A partisine oy vermesi beklenmektedir. 27.04.2017 Selami ÖZCAN İstatistik

BİNOM DAĞILIMINA ÖRNEK Bir fabrikada üretim yapan makinalardan birinin ürettiği ürünlerin 0,09’u kusurlu olarak üretilmiş bulunmaktadır. Bu ürünlerden 4 adedi rastgele seçilmiştir. Hiç özürlü ürün seçilmemiş olma olasılığı nedir? P(k;n;p) = --------- n! k!(n-k)! p k.q n-k 4! P(0;4;0,09) =--------- 0,09 0 . 0,91 4-0 = 0,6857 0!(4-0)!

Selami ÖZCAN İstatistik 3. POİSSON DAĞILIMI Poisson, binom gibi kesikli bir ihtimal dağılımıdır. Verilen bir aralıkta (zaman, hacim aralığı vb) tekrar sayısının ortalaması biliniyorsa poisson kullanılır. X ile gösterilen tekrar sayısına ilişkin herhangi bir değerin ihtimali hesaplanabilir. Üzerinde durulan olayın meydana gelme ihtimali çok küçüktür. n in büyümesi P nin küçülmesi halinde binom yerine poisson formülü kullanılır. Yani np değeri 5 ten küçük olduğunda ʎ: poisson dağılımının ortalaması, bu dağılımın varyansı da ʎ eşittir. Matematik sabiti e ise yaklaşık olarak 2,71828 dir. µ ortalama= ʎ= σ ² varyans, standart sapma σ =√ ʎ Moment çarpıklık ölçüsğ ά3=1/ ʎ moment basıklık ölçüsü:3+1/ ʎ Not: poisson dağılımı normalden daha dik ve sağa çarpıktır. ʎ büyüdükçe dağılım simetrikleşir. Örnek: bir hastanenin acil servisine bir günde gelen hasta sayısı; bir makinede üretilecek 100 parçadan hatalı parça sayısı; bir mağazadan 1 haftada satılan buzdolabı sayısı (randevulu gelen hasta rassal olmadığı için poisson uygulanamaz) Örnek: bir çamaşır makinesi ayda ortalama 3 kez arızalanmakta, poissona göre gelecek ay iki kez arızalanması ihtimali ve en çok bir kez arızalanması ihtimali nedir? Çözüm: a) P(x=2)= b)P(x≤1)=p(X=0)+p(X=1) 27.04.2017 Selami ÖZCAN İstatistik

Poisson Dağılımının İhtimal Fonksiyonu l : belirlenen periyotta ortaya çıkan olay sayısı x : ortaya çıkma olasılığı araştırılan olay sayısı S = { x / 0,1, 2, 3, ….., }

Poisson Dağılımının Beklenen Değer ve Varyansı Beklenen değeri ve varyansı birbirine eşit olan tek dağılıştır.

Örnek: Bir mağazaya Cumartesi günleri 5 dakikada ortalama olarak 4 müşteri gelmektedir. Bir Cumartesi günü bu mağazaya, 5 dakika içinde 1 müşteri gelmesi olasılığını, Yarım saate 2’den fazla müşteri gelmesi olasılığını, a) l = 4 P ( x = 1 ) = ? 5 dk’da 4 müşteri gelirse, 30 dk’da 24 müşteri gelir. l = 24 P ( x > 2 ) = ? P( x > 2 ) = 1 – [P(x=0)+P(x=1)+P(x=2)] ÖDEV: 1 saatte en çok 1 müşteri gelmesinin ihtimalini hesaplayınız.

Poisson Dağılımına Örnek Örnek1: A bankasında günde 2 hesap açılıyor, herhangi bir günde 6 yeni hesap açılması ihtimali, en çok 3 yeni hesap açılması ihtimali, en az 7 hesap açılması ihtimali nedir? a) p(x=6)= ortalama(ʎ)=2, x=6 formülde yerine koyarsak: 0,0120 b) P(X≤3)=P(X=0)+P(x=1)+p(x=2)+p(x=3)=0,8571 c)p(x≥7)=1-p(x<7):1-[p(x=0)+p(x=1)+p(x=2)+p(x=3)+p(x=4)+p(x=5)+p(x=7)]=0,0045 Örnek2: ortalaması x=2,6 poisson dağılışı gösteren bir değişkenin standart sapması nedir? Çözüm: ortalama (µ)=landa (ʎ)=varyans (ó)=2,6 dır. Standart sapması√2,6=1,61 dir. Ör:Bir otomobil satış yerine ayda ortalama 150 müşteri gelmektedir.Herhangi bir günde satış yerini açmayan galeri sahibi %kaç ihtimalle en az 3 müşteriyi kaçırmıştır.(ay=30) Günlük ortalama:150/30=5 tir. 3 veya daha fazla müşteriyi kaçırma ihtimali (iki durum ya 3 ten sonsuza kadar olan ihtimaller hesaplanacak veya 3 ten küçük olanlar (x=0,1,2) hesaplanıp 1 den çıkarılacaktır. P(x≥3)=1-p(x=0)+p(x=1)+p(x=2)=0,8754 %87,54 Örnek: bir havaalanından her 100 uçaktan biri mecburi iniş yapmaktadır. Herhangi bir ayda 4000 uçaktan en çok 2 sinin mecburi iniş yapması ihtimali nedir?0,2381 27.04.2017 Selami ÖZCAN İstatistik

POİSSON DAĞILIMINA ÖRNEK Bir fabrikada üretilen ürünler 0,001 olaslıkla bozuktur. Rastgele örnekleme ile 2000 adet alınmıştır. 4 adet ürünün bozuk olma olasılığı nedir?  = 2000. 0,001 = 2  = n. p = E(x)= V(X) = 4 - 2 2 P(x=k) = e -------- -   k k! P(x=4) = e -------- = 0,09 4!

BİNOM’UN POİSSONA YAKLAŞIMI POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p < 0,05 VE n >20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR. 27.04.2017 Selami ÖZCAN İstatistik

POİSSON’UN BİNOMA YAKLAŞIMI POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p < 0,05 VE n >20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR. BİNOM POİSSON X 1 2 3 n= 5, p= 0,2 n= 20 , p=0,05 =np=1 0,328 0,410 0,205 0,051 0,359 0,377 0,189 0,060 0,368 0,184 0,061

5. HİPERGEOMETRİK DAĞILIM Binom ve hipergeometrik dağılım aynı tür olaylara uygulanır. Örnekleminin şekli önemli, binomda sınırsız anakütleden iadesiz çekilişler veya sınırlı anaküteleden iadeli çekilişler (çekilişler birbirinden bağımsız), bu yüzden binomdaki p değeri çekilişten çekilişe değişiklik göstermez. Hipergeometrikte ise; sınırlı anakütleden iadesiz çekiliş veya bir sonraki çekiliş bir önekine bağımlıdır. Örnek:2 istatistik, 3 bilgisayar, 4 yöneylem hocasından 3 kişilik sayısal yöntemler jürisi oluşturulacaktır. Jüride en az bir istatistik hocasının bulunması ihtimali nedir? Çözüm: P(x≥1)=p(x=1)+P(x=2) P(x≥1)=(2/1).[(9-2)/(3-1)]/9/3 + (2/2).[(9-2)/(3-2)]/9/3 P(x≥1)=42/84+7/84=49/84=05833 Örnek:not ortalaması 85 in üzerinde olan 4 iktisat, 7 işletme öğrencisinden 3 kişilik grup oluşturulacak, grupta bir iktisatçı bulunması ihtimali?N=11 n=3 A=4 Formulde x yerlerine 0 ve 1 konacak P(x≤1)=p(x=0)+p(x=1)=0,7212 27.04.2017 Selami ÖZCAN İstatistik

HİPERGEOMETRİK DAĞILIMA ÖRNEK İçinde 10 sağlam ve 4 arızalı mal bulunan bir topluluktan 5 mal alınmıştır. Bunlardan üçünün sağlam çıkma olasılığı nedir? P(X=x) = -------------------------- Acx . N-Acn-x Ncn N=14 A=10 n= 5 x= 3 P(X=3) = -------------------------- 10c3 . 14-10c5-3 14c5 = 0,3596

6. PASCAL(NEGATİF BİNOM) DAĞILIMI- ÖRNEK Bir imalat hattında kusurlu parça oranı 0,6 olarak bilinmektedir. 5. Parça üretildiğinde 3. Kusurlu parçanın ortaya çıkma olasılığı nedir? P(x)= X-1Ck-1 . p . q k x-k X=5 K=3 P(5)= 5-1C3-1 . 0,6 . 0,4 3 5-3 = 0,2074

Selami ÖZCAN İstatistik Sorular İstatistik birimlerinin sahip oldukları özelliklere ne ad verilir? Veri Şık Parametre Sabit değişken 1,1,2,3,5,8,11,13 basit serisinin medyanı kaçtır? 4 4,5 5 5,5 6 Bir zar 3 kez atıldığında kaç olası sonucu vardır. 112 143 165 210 216 Sınıflar:10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80 Frekans:1,5,7,12,20,24,25 den çok:25,24,20,18,13,5,1 50 den büyük gözlem sayısı kaçtır. 8 12 13 18 20 Anakütleden uygun tekniklerle çekilen birimlerin oluşturduğu alt topluluğa ne ad verilir? Sınıf Örneklem Evren Grup istatistik X=1,3,5,6,8,9 kareli ortalaması nedir? 4,31 5 5,33 5,5 6 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik X=12,23,34,45,56 Değişim aralığı nedir? 12 17 34 44 56 X=3,4,6,8,9 standart sapması nedir? 12,28 5,2 5,53 5 6 Bir örneklemin gözlem değeri için hesaplanan karakteristik değere ne ad verilir? Ortalama Frekans İstaitik Anlam frekansı parametre 1 den 10 kadar sayılar arasından seçilen bir sayının 2 ve 3 e bölünebilen bir sayı olma ihtimali kaçtır? 1/10 1/5 3/10 1/2 1/8 Xi ortalama (µ) standart sapma (sigma)=10 normal dağılım göstermektedir. X=55 değerinin standart normal değeri (z) kaçtır? 0,5 1 1,5 2 5 Kusursuz bir madeni para 2 kez atılmış, 1. atış yazı iken 2.ninde yazı gelme ihtimali kaçtır? ¼ 1/3 ½ 2/3 3/4 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Histogramın temel noktalarının birleştirilmesi ile elde edilen grafik türünün adı nedir? Pasta grafiği Frekans poligonu Sütun grafiği Alan kodu Serpilme diyagramı 10 gözlem değerinden oluşan basit bir serinin aritmetik ortalaması 50 ise bu serideki gözlem değerleri toplam kaçtır? 0,5 5 40 60 500 Sınıflar: 10-15, 15-20, 20-25, 30-35 Frekans: 40, 27, 18, 10, 5 /100 serinin frekans eğrisi aşağıdakilerden hangisidir? Sola eğik J biçiminde Sağa eğik Ters J U biçiminde Ortalamalarla ilgili ifadelerden hangisi yanlıştır? v Birimle ilgili ifadelerden hangisi yanlıştır? q Aşağıdakilerden hangisi tam sayımı engelleyen nedenlerden biri değildir? Maliyetli olması Ölçülen birimde tahrip yapması Anakütle hacminin küçük olması Zaman sınırlaması Anakütle hacminin sonsuz sayıda olması X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 ortalaması kaça eşittir? 1 1,6 2,7 3 3,8 X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 standart sapması kaça eşit? 7 9 10 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Serilere ilişkin ifadelerin hangisi doğrudur? c Aşağıdaki serinin modu nedir? X=3,5,8,13,21,34 Frekans=1,7,2,9,6,4 7 9 11,5 13 14,93 50 birimlik örneklem 3. tabakadan seçilen birim sayısı nedir? 4 15 20 35 40 Standart normal dağılmış (z) bir değişken P(0,52)<z<2,14 ihtimali nedir? 0,1772 0,1985 0,2054 0,2854 0,4838 Başarı ihtimali p=0,2 q=0,8 (başarısızlık) binomyal dağılmış değişkenin varyansı=4/5, deney sayısı n kaçtır? 2 4 5 8 10 X=72 standart sapması=15 bu imtihandan 90 alan bir öğrencinin Z (standart normal puanı) nedir? 1,2 0,7 0,3 -1,0 -1,2 27.04.2017 Selami ÖZCAN İstatistik

6.BÖLÜM: Sürekli İhtimal Dağılımları En çok bilinen sürekli ihtimal dağılımları Üstel Dağılım Gama Dağılımı Weibull Dağılımı Normal Dağılım 27.04.2017 Selami ÖZCAN İstatistik

1. ÜSTEL DAĞILIM Elektronik cihazların ömür ve güvenirlik (reliability) hesaplamalarında çok kullanılan bu dağılımın olasılık yoğunluk fonksiyonunun grafiğinin şekli aşağıdadır. Bu dağılımı tanımlayan en önemli özellik arıza oranıdır(). 0,2 0,16 0,12 0,08 0,04 = 5 = 10 = 15 f(x) 0 20 40 60 80 100 X

ÜSTEL DAĞILIM  = -t R(t) = e -a F(a) = P(x<a) = 1- e  =   ÜSTEL DAĞILIM OLASILIK FONKSİYONU: f(x) =  e - x X > 0  : SİSTEMDEKİ ARIZA ORANI ( >0) ÜSTEL DAĞILIM ORTALAMASI:  = 1   : SİSTEMDEKİ ARIZA ZAMANI ORTALAMASI ÜSTEL DAĞILIM VARYANSI: ZAMANA BAĞLI ALET GÜVENİRLİĞİ:  = 2 1  R(t) = e -t BİRİKİMLİ ÜSTEL DAĞILIM FONKSİYONU: F(a) = P(x<a) = 1- e -a a > 0

ÜSTEL DAĞILIM-ÖRNEK a. E(X) = = = 4 saat  = R(t) = e -t Seri üretim yapan bir fabrikadaki kusurlu mamullerin saat başına  =1/4 parametreli bir poisson sürecine uygun olduğu belirlenmiştir. İç denetçinin saha çalışması için üretim sisteminin başına saat 10:00’ da geldiği varsayıldığında; A. İlk kusurlu ürünün ortaya çıkmasının beklenen zamanını, B.İlk kusurlu ürünün en erken sat 11:00’de üretilmesi olasılığını, C.İlk kusurlu ürünün en geç saat 14:00’de üretilmesi olasılığını bulunuz. 1 1 a. E(X) = = = 4 saat  =  1/4 R(t) = e -t - 0.25t - 0.25(1) b. P(X1) = = e = e = 0.2212 -t -0.25(4) -1 c. P(X=4) = 1-e =1-e = 1-e =1- 0.36788 = 0.63212

2. GAMA DAĞILIMI 0,2 0,16 0,12 0,08 0,04 = 1; r=1 = 1; r=2 = 1; r=3 = 1; r=1 = 1; r=2 = 1; r=3 f(x) 0 20 40 60 80 100 X

GAMA DAĞILIMI r(r) r(r) -x  r-1 (x) e f(x) =  = ( a) - a GAMA DAĞILIMI OLASILIK FONKSİYONU: -x  (x) e r-1 f(x) = r(r) X > 0 ; r >O ;  >O GAMA DAĞILIMI ORTALAMASI: r  =  GAMA DAĞILIMI VARYANSI: 2 r  = ( a)  2 - a k r-1 BİRİKİMLİ GAMA DAĞILIMI FONKSİYONU:  F(a) =1-  e k! F(a) = 1-  00 (t)r-1 e - t dt r(r) k=0

3. WEIBULL DAĞILIMI Olasılık Kuramı ve İstatistik bilim dallarında Weibull dağılımı (Waloodi Weibull anısına isimlendirilmiş) bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu ise :                                       Burada  x ≥ 0     ve x < 0 için f(x; k, λ) = 0. k > 0 şekil parametresi ve λ > 0 Ölçek parametresi olurlar. Weibull dağılımı için Yığmalı(Cumulative) olasılık Fonksiyonu bir gerlmiş üstel (stretched) fonksiyondur. Yaşama, hayatta kalım ve yetmezlikle yıkım süreçlerini inceleyen verilerin analizi alanında Weibull dağılımı çok elastik olup kolayca değiştirilebildiği için çok kullanılmaktadır. Değişik parametre değerleri kullanılarak normal dağılım, üstel dağılım gibi çok popüler diğer istatistiksel dağılımların davranışların Weibull dağılımı kullanarak aynen taklid etme imkânı bulunmaktadır. Eğer k = 3.4 ise, Weibull dağılımı Normal Dağılım’ına benzerlik gösterir. Eğer k = 1 ise o zaman Weibull dağılımı Üstel Dağılımı’na dönüşür. Weibull dağılımı pratikte çok kere normal dağılım yerine kullanılmaktadır. Buna neden Weibull değisebiliri değerlerinin kolay matematik işlemlerle ortaya çıkan ters alma usulu ile üretilebilmekte ve buna karşılık normal değişebilir değerleri rettmek icin tipik olarak daha karmaşık işlemler gerektiren (her normal değer için iki tane tekdüze dağılım değişebilir değeri isteyen) Box-Muller yontemi ile elde etmek gerekmektedir. Endüstriyel mühendislik dalında fabrikasyon ve mal teslim zamanlarını temsil etmek için modellemelerde Weibull dağılımı kullanılmaktadır. Ayni bilim ve teknoloji dalında [[ mühendisliği ve failure analizi için istatistiksel modellere baz olamaktadir. Weibull dağılımı Lucasl deger teorisi ve meteorojide hava tahmin modellemesinde önemli rol oynamaktadir. Radar sistemlerinin modelleme alanında Weibull dağılımı çok popüler olarak rüzgar hızı dağılımını tanımlamak icin kullanılır çünkü doğasal pratik rüzgar hızı çizelgelerine teorik Weibull şekli çok uygun olmaktadır.

4. NORMAL DAĞILIM ±∞ sayıda değer alır. İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir. Standart sapması, frekans eğrisi çan şeklinde olan simetrik dağılımdır. Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, medyan ve modları eşittir. Normal dağılımı meydana getiren birimler ölçme veya tartma yoluyla elde edilen verilerdir. ±∞ sayıda değer alır. Moment çarpıklık katsayısı: ά4=3 Normal dağılım fonksiyonu f(x) = 1/σx√2 e½(x-µx/σx)² e:2,71828 :3,14159 µ: anakütle ortalaması σ:anakütle standart sapması, x:herhangi bir sürekli değişkendir. 27.04.2017 Selami ÖZCAN İstatistik

Dağılım özelliğinin önemi nedir Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir İsa Eşme

NORMAL DAĞILIMIN KRİTERLERİ Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. Normal eğri altında kalan alan 1 e eşittir. Normal dağılımda nokta tahmini yapılamaz bu sebeple aralık tahmini (x1 ve x2 arası) yapılır. İsa Eşme

STANDART NORMAL EĞRİ ALANLARI X-µX σX X değerlerinin standart z değerlerine dönüştürülmesi gerekir. Z tablosundaki Z değerleri 0 ile 3,99 arasındadır. Z=2,14 ün normal eğri alanı nedir? Z tablosundaki normal eğri alanlarını bulmak için; İlk sütundaki 2,1 ve ilk satırdaki 0,04 2,14 ün normal eğri alanı 0,4838 dir. İsa Eşme

Örnek1: Z1=-1,44 ile Z2=2,06 arasındaki alan kaçtır? P(-1,44≤z≤2,06)=0,4251+0,4803=0,9054 Örnek 2: Z1=-1,44 ile Z2=-0,51 arasındaki alan kaçtır? P(-1,44≤z≤-0,51)=0,4251-0,1950=0,2301 Örnek 3: P(z ≤-1,44) değerini bulunuz? P(z ≤-1,44)=0,5-0,4251=0,0749 Örnek 4: P(z ≥-1,44) değerini bulunuz? 0,4251+0,5=0,9251 27.04.2017 Selami ÖZCAN İstatistik

Selami ÖZCAN İstatistik Örnek 5: ortalaması 5 kg, standart sapması 0,15 kg olan bir prosesten tesadüfi bir malın ağırlığı 5,05 kg dan fazla olma ihtimali nedir? X=5,05 standart z değerine dönüştürelim X-µX σX Z=(5,05-5,00)/0,15=0,33 tür. P(x≥5,05) P(z ≥0,33)=0,5-0,1293=0,3707 olur. 27.04.2017 Selami ÖZCAN İstatistik

Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir : 1.      Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak. 2.      Varolan verilere parametrik olmayan bir test uygulamak KESİKLİ DAĞILIMLAR NORMALE YAKLAŞTIRILIR. (BİNOM, POİSSON VE HİPERGEOMETRİK DAĞILIM) İsa Eşme

BİNOM DAĞILIMININ NORMAL’E YAKLAŞIMI n yeteri kadar büyük olması durumunda binom kesikli değişkeni yaklaşık olarak ortalaması np, varyansı npq olan bir normal dağılıma yaklaşır. Ayrıca p ihtimal değerinin 0.5’e yaklaştığı bütün durumlarda binom dağılımı yerine normal dağılım kullanılabilir. Binom dağılımı kesikli standart z normal dağılımı süreklidir. Dönüştürmek için; n 30 , np 5 ve p=0.50 Bu durumda; E(X)=  = np ve Varyans  = npq X -  (X+0,5) - np X -  X - np z = = z = =   npq npq

Örnek 1: Büyük bir şirkettte çalışan personelin % 40’ bayandır Örnek 1: Büyük bir şirkettte çalışan personelin % 40’ bayandır. Çalışanlar arasından rastgele olarak 150 kişi seçilmiştir. Seçilen kişiler içinde kadınların sayısının 56-70 arasında olma ihtimali nedir? n = 150 30 p = 0,40 ~0,50 BU ŞARTLARDA BİNOM NORMAL DAĞILIMA YAKLAŞIR. =np=(150)(0,40)=60 np = 60 5 z = X - np Dağılımın ortalaması =nxp =150x0,40=60 Standart sapması √nxpxq . √(N-n).(N-1) √150x0,40x0,60=6 npq (56-0,5) - 60 Z1= = - 0,75 TABLODAN 0,2734 6 (70+0,5) -60 Z2= = 1,75 TABLODAN 0,4599 6 + 0,7333 Seçilen kişiler arasında bayanların sayısının 56-70 arasında olma ihtimali %73.33’tür.

Selami ÖZCAN İstatistik Örnek 2: Bir fabrikada üretilen mamullerin %10 hatalı, 150 birim alınıyor, 10 mamulun hatalı olma ihtimali kaçtır? Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq . √(N-n).(N-1) √150x0,10x0,90=3,67 X= 10 değerine ±0,5 ilave edilirse; X1=10,5 X2=9,5 Z1=10,5-15/3,67=-1,23 Z2=9,5-15/3,67=-1,50 P(x=10)=P(-1,5<z<-1,23) P(z)=0,4332-0,3907=0,0425 Örnek 3: bir önceki örneğe göre 10 dan az olma ihtimali kaçtır? (10 hariçtir) X=9,5 standart z değeri=-1,5 P(x<10)=P(z<-1,5)= 0,5-0,4332=0,0668 27.04.2017 Selami ÖZCAN İstatistik

POİSSON DAĞILIMININ NORMAL’E YAKLAŞIMI Poisson dağılımında  Parametresi, =np≥5 eşitliğine uygun olması durumunda Poisson dağılımı normal dağılıma yaklaşır. Bu Durumda ihtimallerin Hesaplanmasında; P(x=k) = e -------- -   k k! X -  X -  z = =  √ Formülü yerine = 2 =  =nxp eşitliğinden istifade ederek 

Örnek 1: Bir hastalığın iyileştirilmesi için geliştirilen yeni bir ilaç 20000 hasta üzerinde uygulanmıştır. İlacın yan etkisinin olması ihtimali 0,002 dir. Buna göre ilacın verildiği hastalarda yan etkisi görülenlerin sayısının 36-60 arasında olma ihtimali nedir? n= 20000 p= 0,002 = =np=20000(0,002)=40 5 olduğundan poisson dağılımı normale yaklaşır. V(X)=  = 40 X -  36 - 40 z1 = = = = - 0,1 0,0398  40 X -  60 - 40 z2= = = 0,5 0,1915  40 + 0,2313

Selami ÖZCAN İstatistik Örnek 2: fabrika malzeme yokluğu sebebiyle günde 12 kez durmaktadır. Rastgele seçilen bir günde malzeme yokluğu sebebiyle günde 15 ve daha az durma ihtimali kaçtır? =12 ise z=15,5-12/√12=1,01 P(x≤15)=P(z≤1,01)=0,5+0,3438=0,8438 Örnek 3: bir önceki örneğe göre günde 12 kez durma ihtimali kaçtır? X1=11,5 X2=12,5 Z1 =11,5-12/√12=-0,14 Z2=12,5-12/√12=0,14 P(x=12)=P(-0,14<z<0,14)=0,0557+0,0557=0,1114 %11,14 27.04.2017 Selami ÖZCAN İstatistik

HİPERGEOMETRİK DAĞILIMIN NORMALE YAKLAŞIMI Nxp≥5 olduğunda hipergeometrik dağılım normale yaklaşır. Sınırlı anakütleden iadesiz çekilişler yapıldığı için standart sapma düzeltme faktörü ile çarpılır. Standart z formülündeki anakütle ortalaması ve standart sapma yerine hipergeometrik dağılımın ortalama ve standart sapması yazılarak ihtimal dağılımı hesaplanır. Z= (x-np)/ √npq . √(N-n/N-1) x değişkeni süreklilik düzeltmesine tabi tutulur. 27.04.2017 Selami ÖZCAN İstatistik

Hipergeometrik dağılımın normale yaklaşımına Örnekler Örnek 1: 1000 mamulun %10 hatalı, iadesiz alınan 150 adetin ise 8 den az olma ihtimali kaçtır. Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq . √(N-n).(N-1) σ=√150x0,10x0,90 x √(1000-150)/(1000-1) σ=3,39 8 den az dendiği için 7,5 Z=7,5-15/3,39=-2,21 P (x<8) =P(Z<-2,21)=0,5-0,4864=0,0136 %1,36 Örnek 2: 1.Örneğe göre 10 ve daha fazla olma ihtimali kaçtır? (10 ve yukarısı başlangıç 9,5) Z= 9,5-15/3,39= -1,62 P(x≥10)= P(z ≥-1,62)=0,4474+0,5= =0,9474 %94,74 27.04.2017 Selami ÖZCAN İstatistik