Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

27.04.2017 İSTATİSTİK I Doç. Dr. Selami ÖZCAN.

Benzer bir sunumlar


... konulu sunumlar: "27.04.2017 İSTATİSTİK I Doç. Dr. Selami ÖZCAN."— Sunum transkripti:

1 İSTATİSTİK I Doç. Dr. Selami ÖZCAN

2 Selami ÖZCAN İstatistik
BİRİNCİ BÖLÜM İSTATİSTİKLE İLGİLİ TEMEL KAVRAMLAR Selami ÖZCAN İstatistik

3 Selami ÖZCAN İstatistik
1. Bölüm: Sunum Planı İstatistiğin Doğuşu, Gelişimi İstatistik nedir? Ve kaça ayrılır? Anakütle ve örnek; istatistik ve parametre nedir? İstatistiksel örnekleme yöntemleri kaça ayrılır? Değişken nedir ve kaça ayrılır? Veri toplama yöntemleri Veri Derleme:Verilerin düzenlenmesi Ölçme nedir? Kaç çeşit ölçek vardır? Selami ÖZCAN İstatistik

4 Selami ÖZCAN İstatistik
İstatistiğin Doğuşu İstatistik başlangıçta teknik bir disiplin olarak ele alınırken günümüzde bir bilim dalı olarak kendini kabul ettirmiş, ulusal ve uluslararası boyutta gelişmelerin temelini oluşturmuştur. Son 30 yıla damgasını vuran ve çağımızda bilgi çağı olarak adlandırılan gelişmeler istatistiği evrensel bir konuşma dili haline getirmiştir. Günümüzde ulusal ve uluslararası sosyal ve ekonomik gelişme hedeflerinin belirlenmesi ve bu hedeflerin başarısı güncel, güvenilir istatistiklerle sağlanmaktadır. Doğru bilgi, doğru yorum ve doğru karar sürecinde araştırmacılar, politikacılar, karar alıcılar ve tüm bireyler çalışmalarında istatistiki bilgileri etkin olarak kullanmaktadırlar. İlk çağda bile insanlar bazı toplu olayları belirleme ihtiyacı duymuşlardır. Devletlerin kurulması ile birlikte insanlar sınır belirleme, vergi toplama, toprak dağılımına yönelik amaçlarla ayrıca dil, din farkı olan toplulukların nüfus büyüklüğünü belirleme, askere alma amaçlı bilgiler toplamaya ve bunların kayıtlarını tutmaya başlamışlardır. Orta çağda devletler güçlerini yitirmiş, istatistik konusu gerilemiş ve kent düzeyinde bazı bilgilerin toplandığı değerlendirmelerle sınırlı kalmıştır. Devletlerin güçlenmesi ile birlikte istatistik uygulamaları gelişmiş ve nüfus sayımları yanında; dış ticaret, milli gelir hesabına yönelik fiyat, ücret vb. temel verilerin toplanmasına başlanmıştır. İstatistik metodolojisine yönelik çalışmalar 17. yüzyılda Alman Üniversitesinde "Devletlerin Durumu" adlı bir derste bilimsel olarak gündeme gelmiştir. Derste ülkelerin tarihi, mali, askeri yönetim örgütleri, nüfusları sayılarla ifade edilerek ele alınmış ve bu konu sonradan istatistik olarak adlandırılmıştır. Aynı dönemde sigorta matematikçileri nüfus konusu ile ilgilenmeye başlamışlardır. Selami ÖZCAN İstatistik

5 İstatistiğin Gelişimi
17. yüzyılda Pascal, Bernouilli, Moivne, Laplace, Poisson ve Gauss tarafından yapılan çalışmalar ile ihtimal teorisi, talih oyunları ve tesadüfi olayların çan eğrisi şeklinde dağılım gösterdiği belirlenmiştir. Aynı yüzyılda Belçikalı matematikçi ve astronom Quatelet istatistik sorunlarına eğilmiş, çeşitli eserler yazmıştır. İstatistik Genel Müdürü olan Quatelet istatistiğin kullanım alanını genişleterek kültür, ahlak, doğal olaylar ve özellikle antropometriye yönelik bilgileri değerlendirmiştir. Orta Asya da büyük uygarlıklar kuran Türk toplumları Hindistan'da, Çin'de, İran'da bilgiye önem vermişler, İlhanlılar ve Selçuklular nüfus sayımı çalışmaları yapmışlardır. İstatistikleri tarihi perspektifte değerlendirmek, geçmişi daha iyi anlamak, günümüzü en etkin yapıda kavramak ve geleceğimizi en iyi şekilde planlamamız açısından da çok büyük önem taşımaktadır 17. Yüzyıla kadar sadece bilgi kaydetme şeklinde gerçekleşen istatistiki çalışmalar, 18. ve 19. Yüzyıllarda J. Bernoulli ( ) ve K.Gauss'un ( ) katkılarıyla matematik temelleri üzerine oturtulmuş, ihtimal teorisi geliştirilmiştir. Sosyal ve antropolojik olaylara istatistiği kapsamlı bir şekilde uygulayan ilk matematikçi olan Adolphe Quételet ( ) ise modern istatistiğin kurucusu olarak kabul edilmiştir. 20. Yüzyılın başında R. A. Fisher, K. Pearson ve W. S. Gosset'in katkılarıyla tahmin yapma ve karar verme konuları ön plana çıkarak istatistik artık sayısal verilerin yorum ve değerlendirmesini yapan bir bilimsel metodlar topluluğu haline gelmiştir. Selami ÖZCAN İstatistik

6 İSTATİSTİK BİLİMİ NEDİR?
İstatistik kelimesi ilk olarak Almanya’da devlet anlamına gelen status kelimesine dayanılarak kullanılmaya başlanmıştır. Günlük dilde istatistik veya istatistikler; belirli bir olaya ilişkin derlenmiş sayısal bilgiler demektir.İthalat, ihracat, turizm ve inşaat vb. istatistikler bazen sayı ve rakam karşılığında da istatistik kullanılır İstatistik sözcüğü, ele alınan olayların gözlemlenerek ilgili verilerin derlenmesi, işlenmesi, analizi ve yorumlanmasında kullanılan tekniklerin tümünü ifade eder. Dar manada İstatistik: geçmiş ve şimdiki durumla ilgili toplanmış sayısal verileri, geliştirilmiş olan bazı tekniklerle analiz ederek gelecek hakkında karar vermemizi kolaylaştıran bir bilim dalıdır. Geniş Manada İstatistik: belirli amaçlar için verilerin toplanması, düzenlenmesi, uygun yöntemlerle analiz edilmesine denir. Bu analizler vasıtasıyla elde edilen sonuçların YORUMLANMASI ve Bir KARARA bağlanması istatistikle ilgilidir. İSTATİSTİK: Belirlenen amaç/lar doğrultusunda gözlenen yığın olaylardan derlenen sayısal verilerin işlenerek , ilgili olayların oluşturduğu yığınların bilimsel olarak incelenmesinde kullanılan teknik ve yöntemler bilimidir. Rakamlar yalan söylemez, yalancılar rakam söyler. Rakamsal Bilgileri Anlamlandırmak , Belirsizlik ile İlgilenmek, İlişkileri analiz etmek Tahmin , Belirsiz Ortamda Karar Verme Üç türlü yalan vardır. Yalan, kuyruklu yalan, İstatistiki yalan Selami ÖZCAN İstatistik

7 (konuları açısından) İstatistik ikiye ayrılır
Deskriptif (tasvir edici-tanımlayıcı) istatistik genel dağılımı ortaya çıkarma, durumu olduğu gibi tasvir etme, kollektif olayların eğilimini araştırır, verilerin özetlenmesi ve tasvir edilmesi ile ilgilidir. Frekans dağılımları Merkezi Eğilim (Yer) ölçüleri Parametrik MEÖ Aritmetik ortalama Geometrik ortalama Harmonik ortalama Kareli ortalama Parametrik olmayan MEÖ Mod Medyan kantiller Dağılım ölçüleri Parametrik dağılım ölçüleri Ortalama sapma Standart sapma Standart hata Varyans Parametrik olmayan dağılım Ölçüleri Değişim aralığı Kartil aralığı Desil aralığı Çarpıklık ve Basıklık İhtimal (toplama, çarpma) İhtimal dağılımları Kesikli ihtimal dağılıları Binom dağılımı Poisson dağılımı Hipergeometrik dağılım Sürekli ihtimal dağılımları Normal dağılım Standart normal dağılım Normalin Binoma yaklaşım 2. İndaktif (tahlil edici-çıkarımcı) istatistik Çıkarımlar mutlak doğru olmadığı için ihtimal kelimesi ile ifade edilir, ileri seviye istatistik bilgisi gerektirir, tümevarım yöntemi kullanılır. Hipotez testlerini içerir. Örnekleme teorisi Ortalama Oranlama Tahmin teorisi (güven sınırları) Oran Hipotez testleri Tek yönlü Çift yönlü Varyans Analizi Regresyon analizi Basit Çoklu Zaman serileri Korelasyon Non parametrik testler İndeksler Kalite Kontrol Selami ÖZCAN İstatistik

8 Tipik Olay ve Yığın Olay İstatistik ve Parametre
Yığın Olay: bir olaylar kümesinde tek bir olay kümedeki diğerlerini veya ait olduğu kümeyi tam olarak temsil edemeyen olaylardır. İstatistik yığın olaylarla ilgilenir. Trafik kazaları, evlenmeler, boşanmalar, doğum ve ölüm oranları, yıllık satışlar, ciro vb. Tipik Olay: bir olaylar kümesinde tek bir olayın tüm olaylar kümesini temsil ettiği olaylara denir. Laboratuarda suyun elde edilmesi, Parametre: ana kütledeki bütün birimler üzerinden hesaplanan ölçülere denir. İstatistik: ana kütleyi temsil etme gücüne sahip bir örnekteki verilerden hesaplanan ölçülere denir. Selami ÖZCAN İstatistik

9 Birim (Örnek), birim türleri
1. Birim (Örnek/örneklem): yığın olay niteliğindeki her olaya denir. Ana kütleden tesadüfi yöntemlerle seçilerek oluşturulan yeni oluşuma denir. Birim olması için bir nesne/olayın ölçülmesi veya sayılması yeterlidir. Mesela elle tutulamayan ve gözle görülemeyen, ölçülemeyen ve sayı ile ifade edilemeyen soyut (sevinç, korku, aşk, üzüntü, melek gibi) olaylar birim oluşturmaz. Fakat doğum, ölüm, trafik kazası, insan, hayvan, bina gibi sayılabilen ve ölçülebilen canlı ve cansız varlıklar ile olaylar, sayılarla ifade edildiği için birim oluşturlar. Birim (örnek) Türleri: 1. Maddi birim ve Gayri maddi birim: okul, insan, buzdolabı, araçlar (uzunluk, genişlik ve yükseklik) gibi bir boyuta/varlığa sahip olan, elle tutulup gözle görülebilen somut varlıklar (insan, araba)-Maddesel varlığı (boyutları) olmayan fakat gerçekte olan birimlerdir. Mesela Boşanma, evlenme, doğum, ölüm, trafik kazası gibi 2. Sürekli birim ve Ani birim: belirli bir zaman aralığı (herhangi bir anı) içinde gözlemlenen birimler sürekli: (insan, ticari kuruluş, konut, araçlar sürekli birimlerdir ) bir olay bir fiil biçiminde çıkan oldukça kısa süren(zaman içine dağılmış) birimler ani: Belirli bir anda çıkan ve ancak ortaya çıktıkları anda incelenebilen, maddesel varlığa sahip olmayan birimlerdir. Evlenme, boşanma, trafik kazası, ölüm ani birimlerdir 3. Doğal birim ve Yapay birim: bir bütün oluşturan, parçalanmaları/birleştirilmeleri halinde özelliklerini kaybeden birimlere doğal: (tek parça olarak incelenen olaylar, Örneğin masa, araba, insan, kalem doğal birimlerdir), bir bütün olma özelliği göstermeyen fakat nitelikleri değişmeyen birimlere yapay birim denir. (arsanın parçalara ayrılması, kumaş parçalara ayrılırsa özelliğini kaybetmez ) 4. Gerçek birim ve Gerçek farz edilen (varsayılan) birim: maddesel olarak veya fiil biçiminde var olan birimler gerçek, ortaya çıkmış olması yeterli: Ev, araba, bina, masa maddesel varlığa sahip gerçekte var olan birimleri oluştururken, ölüm, evlenme, doğum, trafik kazası gibi maddesel bir varlığa sahip olmayan ama gerçekte var olan birimler gerçek birimleri oluşturur, gerçekte olmayan varsayılarak oluşturulan birimler. 10 öğrenciden 3 lü grup oluşturmak gibi Selami ÖZCAN İstatistik

10 2. Ana kütle, Ana kütle türleri
2. Ana kütle (istatistik kütlesi): yığın olay niteliğindeki aynı cins birimlerin oluşturduğu topluluğa denir. Veya bir istatistiki araştırmada araştırmaya konu olan bütün birimler aynı nedenlerin etkisinde olması gerekir. Anakütle, istatistik birimleri toplamından farklı bir yapıya sahip olmamalıdır. Üniversite öğrenci ve hoca toplamından farklı bir tüzel kişiliğe sahiptir. Ana kütle türleri: 1. Gerçek anakütle, farazi (varsayılan) anakütle, gerçek birimlerin oluşturduğu anakütle, henüz oluşmamış fakat oluşturulması mümkün olan anakütle varsayılandır. 30 kişilik bir sınıfta rastgele seçilecek 5 kişilik bir grup c(30:5)=142.4 farklı şekilde olur. 2. Sonlu veya Sonsuz anakütle: sayılabiliyorsa sonlu, sayılamıyorsa sonsuz, Türkiye’de yaşayan kişiler sonlu, Marmara’daki canlı sayısı sonsuz. 3. Sürekli veya Kesikli anakütle: parçalandıklarında ve birleştirildiklerinde özelliğini kaybediyorsa kesikli(doğal birimlerden oluşur), kaybetmiyorsa sürekli anakütle(zaman ve mekan birimleri doğal değildir.) Mesela: bir üniversite öğrencileri üzerinde bir araştırma yapılacaksa Üniversitenin bütün öğrencileri ANAKÜTLE, bu öğrenciler arasından seçilen 100 kişilik şans grubuna ÖRNEK denir. Şayet araştırma İİBF bütün öğrencilerine yönelik bir araştırma yapılıyorsa okulun toplam öğrenci sayısı ana kütleyi oluşturur, içinden tesadüfi olarak seçilen 30 öğrenci örnek kütleyi oluşturur. Not: bir istatistiksel araştırma planlanırken araştırmanın nerede yapılacağı, kimlerle/kimler tarafından yapılacağı, ne kadar zamanda yapılacağı, araştırma için ayrılan kaynaklar, toplanacak veriler çok önemlidir. Selami ÖZCAN İstatistik

11 VERİ DERLEME (düzenleme)
VERİ DERLEME: belirlenen amaçlar doğrultusunda gözlemlenecek birimlerin ölçülmesi, sayılması sonra da bunların ilgilenilen değişkenlere göre hangi şıklara sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içerir. A. Birim Seçimi: belirlenen amaç/lar doğrultusunda ilgilenilen yığın olayın tanımlanmasıyla seçme işlemi gerçekleşir yani ilk önce kimlerin veya nelerin gözleneceği belirlenir. B. Değişken ve Şıkların Belirlenmesi Değişkenin Belirlenmesi: Veri derlenirken sadece belirlenen amaçlar doğrultusunda değişkenler göz önünde tutulur. Ayrıntı sorunlara neden olabilir. Gözlem sayısı sonlu bir sayı olmalıdır. Şıkların Belirlenmesi: şık, belirli bir özelliğin ortaya çıkış şekillerine denir. Gözlemlerde kullanılan ölçü biriminin araştırmaya uygun olması gerekir. Tabi ki şıkların alacakları değerler de (ilgilenilen değişken sürekli veya kesikli olsun fark etmez) sonlu olmalıdır. Şıkların aldığı ölçü birimleri de ilgilenilen olaya uygun olmalıdır. Kilo, şişe, teneke, gram vb C. Anakütlenin Sınıflandırılması Veriler hangi yöntemle toplanırsa toplansın, elde edilen veriler genellikle istatistiksel analize hazır değildir (bu veriler ham veri olarak adlandırılır) Bu verilerin analize uygun hale getirilmesi için düzenlenmeleri gerekir. Veri Derleme Türleri: Ani ve sürekli veri derleme: sürekli birimlerin belli bir andaki durumlarını gözlemlemek için yapılan derlemelere ani derleme; ör: nüfus ve işyeri, tarım ve sanayi sayımları sayılabilir. Sürekli veri derleme,olayların aynı anda ve bir arada meydana gelemedikleri durumda sürekli olarak incelenmesidir. Anlık birimlerin belirli bir zaman aralığında gözlemlenmesidir. belirli bir bölge ve zamanda evlenme, boşanma, trafik kazası oranları Direkt ve Endirekt veri derleme: doğrudan ana kütle birimlerinin gözlemlenmesi durumunda direkt;söz konusu anakütle ile birlikte diğer anakütle birimlerinin gözlemlenmesi durumu ise endirekt veri derlemedir. Doğrudan nufus sayımı ile ülkede yaşayan sayısı tespit edilebileceği gibi bunun yanında konut sayımı ile de nufus tespiti yapılabilir. Birincil ve İkincil veri derleme: bilgi edinmek için yapılan derlemelere birincil (anlık), idari ve mali amaçlarla yapılan derlemelere ikincil (sürekli) veri derleme denir. Asıl ve yardımcı şeklinde veri derleme: anakütleyi oluşturan birimlerin özelliklerinin belirlenmesi amacıyla yapılan derlemeye asıl, asıl derlemeye yardımcı olmak için yapılan derlemeye yardımdı denir. Genel ve kısmi veri derleme: bilgi edinilmek istenen kütlenin tamamının gözlenmesine genel veri derleme, genel nüfus sayımları vb.; bilgi edinmek istenen kütleyi oluşturan birimler arasından belirlenen amaçlar doğrultusunda yanlızca bir kısmının seçilip gözlenmesine kısmı veri derleme denir. Pahalı oluşu, zaman alışı, gözlem birimlerinin fiziksel zarara uğraması vb nedenlerle kısmi veri toplanır. Kısmi veri derleme: ÖRNEKLEM (örneği oluşturmak için anakütleden seçilen birimlerin oluşturduğu topluluktur. Topluluğu oluştururken seçilen teknikler şunlardır: Rassal (tesadüfi)örneklem : anakütledeki her bir birimin örneğe girme şansı eşit ise rassal örnekleme İradi (isteyerek) örneklem: girmesi mümkünler arasında eşit şans gözetilmez/ fark gözetilirse olur. (7.bölümde ayrıntılı anlatılacaktır.) Selami ÖZCAN İstatistik

12 Değişken nedir? Kaça ayrılır?
Değişken (Özellik): gözlemden gözleme değişik değerler alabilen objelere, özelliklere veya durumlara denir. İstatistik birimlerin sahip oldukları özellikler değişken,değişkenlerin aldıkları değerlere ise şık tır Doğum yerleri, yaş, ağırlık, uzunluk vb. özellikler değişkendir. Aldıkları değerlere de şık denir. Değişken Türleri: 1.Mekan değişkeni:değişkenin şıklarının mekana göre oluştuğu değişkenlerdir. Doğum yeri, Üniversitenin kurulduğu şehir vb., 2.Zaman değişkeni:değişkenin şıklarının zamana göre oluştuğu değişkenlerdir. Doğum yılı, Üniversitenin kuruluş yılı vb. 3.Maddi değişkeni:mekan ve zaman değişkenin dışındaki değişkenler. İnsanların medeni hali, birim değişken maliyetler, istatistikten alınan notlar vb. 1. KALİTATİF (Sayısal olmayan) değişkenler Değişik derecelerde az veya çok değerler alan değişkenlerdir. Ör: doğum yeri, göz rengi, ırk, nüfus, cinsiyet, medeni durum, din vb. 2. KANTİTATİF (Sayısal) değişkenler Gözlemden gözleme farklılık gösterirler fakat bu farklılık derece yönünden değil kalite, miktar ve çeşit yönündendir. Ör: yaş, ağırlık, zeka seviyesi, hava sıcaklığı, Hesabınızdaki bakiye, sınıftaki öğrenci sayısı vb. Selami ÖZCAN İstatistik

13 DEĞİŞKENLERİN SINIFLANDIRILMASI
bir ailedeki çocuk sayısı bir yılda satılan bilgisayar sayısı bir kişinin kilosu bir kişinin boyu Selami ÖZCAN İstatistik

14 KANTİTATİF (SAYISAL) DEĞİŞKENLER
2. Sürekli değişkenler (belirli aralıkta sonsuz sayıda değer alabilen değişkenlere denir) Ölçülen ve tartılan değişkenler Ör: yaş, uzunluk ve ağırlık vb 1. Kesikli değişkenler (yalnız belirli tamsayı değerleri alabilen) Sayılabilen değişkenler Ör: cinsiyet, medeni durum Selami ÖZCAN İstatistik

15 Veri kaynakları, Veri toplama araçları ve yöntemleri
Veri toplama yöntemleri Anket (yazılı iletişim) Geleneksel cevaplayıcının yönettiği, Posta Faks Elden bırakıp alma araştırmacının yönettiği Telefonla anket Biçimsel olmayan mülakat Modern e posta anketi İnternet anketi Mesajlaşma Gözlem (olayların ortaya çıktığı sırada sistematik biçimde inceleme tekniğidir) Katılımlı gözlem Dışarıdan gözlem Doğal gözlem Simülasyon gözlemi(kişi/grup oyun) Görüşme: tek tek veya grup ile sözlü veya hareketli iletişim yoluyla veri toplama yöntemidir. Deney Veri Kaynakları Birincil Veriler Anket Gözlem (örnek olay) Mülakat İkincil Veriler Dokümantasyon (yazılı) Çok kaynaklı (alan çalışması, zaman serileri) Anket (sayımlar ve anketler) Veri Toplama Araçları Soru kağıdı (anket formu) Açık uçlu sorular (size göre…) Kapalı uçlu sorular (evet, hayır) Anketör (gözlemci) Ücretli, gönüllü zorunlu Devamlı, geçici Selami ÖZCAN İstatistik

16 Selami ÖZCAN İstatistik
Ölçme ve Ölçekler Ölçme: nesne veya fertlere belirli bir özelliğe sahip oluş derecelerini belirtmek için belirli kurallara uyarak sembolik değerler verme işlemine denir. İstatistiki bir araştırmaya konu olan verileri ölçmeye yarayan ölçekler 4’e ayrılır. Nominal(sınıflama) ölçek: istenen özelliğin olması(1) olmaması(0) hatalı-hatasız, kız-erkek, Ordinal (sıralama) ölçek: yarışmacıların sıralanması 1., 2., 3., veya 1. tercih, 2. tercih, likert tipi sıralama, hiç beğenmedim(1) beğenmedim(2) biraz beğendim(3), beğendim(4), çok beğendim(5) Aralık ölçeği: belirli iki değer arasında sonsuz değer alır. Bu durum için aralıklar belirlenir. 500 altı, ytl, ytl, ytl, 2001 ve üzeri Oran ölçeği: ağırlık ve boy ölçüleri , metre, kg gibi Selami ÖZCAN İstatistik

17 Ölçeklerde Uygulanabilecek İstatistikler
Mukayese Ortalama Örnekler Nominal Kimlik Mod Cinsiyet, göz, saç rengi, meslekler, araba plakaları, forma no vb. Ordinal Sıralama Medyan Marka tercihi, sosyal sınıflar, bölüm tercihi, ilk 500 firma vb. İnternal Aralık Aritmetik Sıcaklık ölçeği, başarı puanı, markaya karşı tutum, vb. Rasyo Oran Tüm işlemler Satış miktarı, müşteri sayısı, ağırlık, zaman, mutlak değer olan herşey Selami ÖZCAN İstatistik

18 Selami ÖZCAN İstatistik
ANALİZ TEKNİKLERİ 1. DEĞİŞKEN SAYISINA GÖRE Tek değişkenli (değişken üzerinde değişik grupların veya cevapların dağılımı) t testi, z testi, ki kare, one way anova testi, mann whitney u testi Çok değişkenli (bağımlı ve bağımsız değişken) korelasyon, regresyon, faktör, ayrım ve kümeleme analizi 2. AMAÇLARA GÖRE Farklılıkların tespitine yönelik t testi, ki kare testi, z testi, anova testi İlişkilerin şiddetini ölçmeye yönelik Bağımlılık ölçümü Selami ÖZCAN İstatistik

19 ANALİZ TEKNİKLERİ 3.Veri Özelliklerine Göre
Parametrik analiz teknikleri ve ön şartları z testi: örnek büyüklüğü n>=30 t testi: örnek büyüklüğü n<30 F testi: varyans analizi Ki kare testi Anova testi One way anova Korelasyon Regresyon Çok değişkenli analiz teknikleri Ön şartları Verilerin aralık/oran ölçeğinde ölçülmüş olması gerekir Veriler normal dağılım göstermeli Hedef kitlede yer alan bütün gruplar aynı varyans değerine sahip olmalı Hata değerleri tesadufi olmalıdır Parametrik olmayan analiz teknikleri Tek örnek durumu için İşaret testi K S testi Run testi Eşlenik çift örnek durumu için Wilcoxun eşlenik testi İki bağımsız örnek durumu için Mann Witney U testi (t testi ile aynı) Wilcoxin sıra toplam testi Wilcor sıra sayıları testi İkiden fazla örnek durumu için Kuruskev Walls testi Frigman testi Selami ÖZCAN İstatistik

20 Selami ÖZCAN İstatistik
İKİNCİ BÖLÜM İSTATİSTİK SERİLERİ (FREKANS DAĞILIMLARI) Niçin frekans dağılımı yapılır? Veriyi gruplara ayırarak anlaşılabilir hale getirmek için Gözlenme sıklıklarını ve ihtimallerini belirlemek için Selami ÖZCAN İstatistik

21 Selami ÖZCAN İstatistik
2.Bölüm: Sunum Planı Seri türleri Kantitatif seriler Zaman ve mekan serileri Frekans dağılımları Kümülatif seriler Birleşik seriler Kalitatif seriler Serilerin grafikle gösterimi Selami ÖZCAN İstatistik

22 Selami ÖZCAN İstatistik
İstatistik serileri İstatistik serileri : gözlem değerlerini (ham verileri) anlamlı kılma (büyüklüklerine göre sıralama) yollarından biridir. Seriyi oluşturan gözlem değerlerinin her birine terim denir. Kütleyi oluşturan kollektif olayların her birine birimdir. Terim ise birimleri oluşturan gözlem değerlerinden her biridir. Terim sayısı ile birim sayısı birbirine eşit olur. Seri türleri 1. Kantitatif seriler Zaman ve mekan serileri: gözlem sonuçlarının (yıl,ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman; yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. Frekans Serileri: bu serilere bölünme, dağılma serileri de denir. Ham verilerin basit seri, frekans serisi ve sınıflandırılmış/gruplandırılmış seri şekline dönüştürülmesidir. Kümülatif (birikimli) seriler: Bileşik seriler: gözlem değerlerini iki veya daha fazla değişkene göre hir araya getiren serilere denir. Aylık gelir ve gider arasındaki ilişkinin ölçülmesi 2. Kalitatif seriler (dikey eksende frekanslar, yatay eksende sınıf veya grup değerlerinin yazıldığı grafik şeklidir. Simetrik:normal dik ve basık seriler), asimetrik(sağa ve sola eğik) seriler; çok tepeli ve J/ters J şeklinde seriler ve U şeklinde seriler vardır. Verilerin grafikle gösterilmesi Basit serinin grafikle gösterilmesi: Çubuk grafiği Sınıflandırılmış serinin grafikle gösterilmesi: Histogram, Frekans poligonu, Birikimli (kümülatif)serilerin grafikle gösterilmesi Bileşik serilerin grafikle gösterilmesi Selami ÖZCAN İstatistik

23 Zaman ve mekan serileri
ZAMAN SERİSİ: gözlem sonuçlarının (yıl, ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman serisi Yıllar Satışlar MEKAN SERİSİ: gözlem sonuçlarının yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. İller Satışlar İstanbul Ankara İzmir Selami ÖZCAN İstatistik

24 Selami ÖZCAN İstatistik
Frekans Dağılımları 2. FREKANS SERİSİ: basit seriyi özetlemek veya daha anlaşılır hale getirmek için yapılır. Frekans:tekrarlanma sayısıdır. Frekans serisi ise:gözlem değerlerinin yanına kaç kez tekrarlandığı yazılarak oluşturulan seridir. f harfi ile ifade edilir. ÖRNEK1: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz X f 0 3 1 4 2 5 3 6 4 3 5 2 6 1 Toplam 25 Ham veri: gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığınıdır. 1. BASİT SERİ: elde edilenen ham verilerin büyükten küçüğe veya tersi alt alta veya yan yana sıralanmasına denir. ÖRNEK1: Bir işletmede 25 çalışana verilecek çocuk yardımı ile ilgili bir araştırma yapılmaktadır. çalışanların çocuk sayıları aşağıda verilmiştir. Ham veri: 0 , 1 , 3 , 3 , 2 , 1 , 0 , 8 , 4 , 2 , 3 , 2 , 5 , 0 , 6 , 3 , 5 , 4 , 1 , 3 , 2 , 2 , 3 , 1,4 Basit seri: 8 , 6 , 5 , 5 , 4 , 4 , 4 , 3 , 3 , 3 , 3 , 3 , 3 , 2 , 2 , 2 , 2 , 2 , 1 , 1 , 1 , 1 , 0, 0, 0 Örnek 2.Ham veriler Basit seri . Selami ÖZCAN İstatistik

25 Selami ÖZCAN İstatistik
Selami ÖZCAN İstatistik

26 Selami ÖZCAN İstatistik
3. SINIF/GRUPLANDIRILMIŞ SERİ Hesaplama kolaylığı için eşit büyüklükte sınıf/gruplandırılır. Grup aralığını gösteren “aralık katsayısı”nın bulunması için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini/istenen grup sayısına bölünür. Az sayıda grup veri kaybına, çok sayıda grup işlemlerin zorlaşmasına neden olur. İlgili kavramlar Sınıf Değeri/orta noktası: Her grub veya sınıf bir sayı ile temsil edilir. Bu sayı her grubun orta noktasıdır. Buna sınıf değeri denir. Bu sınıf değeri frekans serisindeki X değeri gibi işlem görür. alt ve üst sınıf uçlarının veya alt ve üst sınıf sınırlarının toplanıp ikiye bölünmesiyle elde edilir. Sınıf büyüklüğü veya aralığı: alt ve üst sınırlar arasındaki farka denir. h ile gösterilir. Başlangıç ve bitiş sınırları belirtilmeyen sınıflara açık sınıflar denir. Sınıf aralığı dar tutulursa sınıf sayısı artar frekans dağılımının anlaşılması zorlaşır. Geniş tutulursa sınıf sayısı azalır sonuçta dağılıma ait bazı değerler gizli kalır. Uygulamada sınıf sayısı: 7-20 yada arasında olmalıdır. Sürekli gruplandırılmış seri: sınıf uçları sınıf sayısına eşitse yani bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlıyorsa sürekli gruplandırılmıs seri demektir. Sınıf sınırları: sürekli gruplandırılmış bir seride her sınıfın alt ve üst değerlerine denir. Sınıf uçları: Her sınıfın ilk rakamı alt sınıf ucu, son rakamı ise üst sınıf ucudur. Sınıf uçları sınıf sınırlarına eşittir. Kesikli gruplandırılmış seri: bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlamıyorsa kesikli gruplandırılmıs seri denir. sınıf sınırları: kesikli gruplandırılmış bir seride bir üst sınıfın alt ucundan bir alt sınıfın üst ucu çıkarılıp ikiye bölünerek elde edilir. Bu değer bütün alt sınıf uçlarından çıkarılır ve bütün üst sınıf uçlarına eklenir. Selami ÖZCAN İstatistik

27 Selami ÖZCAN İstatistik
3. Sınıf/ Gruplandırılmış seriye Örnekler Sınıf /Grup Aralık Katsayı formülü: (en yüksek – en düşük) / istenen sınıf/grup sayısı Sınıf /Grup Sayısı formülü: eşitsizliği dikkate alınır. k sınıf sayısı n: toplam veri sayısı . . ÖRNEK: Daha önce frekans serisi olarak düzenlenen örneği 2 eşit aralıklı gruplandırılmış seri olarak düzenleyiniz. Frekans SınıflGruplandırılmış X f Sınıflar frekans 5 2 toplam: 25 6 1 8 1 Top:25 10 sınıf olacak şekilde (94-28)/10=6,2yaklaşık 7 aralık katsayısı olur;28 dahil 7 sayarsak ilk sınıf olur. Selami ÖZCAN İstatistik

28 Selami ÖZCAN İstatistik
Örnek1: 100 öğrencinin istatistik dersinden aldığı notlar aşağıdaki gibidir. 89, 57, 57, 93, 97, 65, 33, 71, 42, 85, 47, 63, 76, 49, 88, 82, 50, 62, 93, 39, 76, 84, 54, 87, 56, 39, 49, 70, 74, 77, 81, 99, 73, 48, 57, 89, 55, 73, 86, 35, 66, 79, 85, 72, 91, 39, 49, 84, 66, 58, 65, 81, 84, 43, 62, 95, 58, 64, 77, 93, 74, 68, 76, 65, 61, 81, 37, 45, 89, 22, 50, 68, 87, 51, 45, 89, 95, 87, 91, 43, 71, 93, 67, 49, 65, 96, 84, 79, 77, 80, 93, 65, 89, 99, 64, 53, 62, 86, 69 Bu verilere göre Notların değişim aralığını bulunuz. Bu verileri basit seri haline getiriniz. Bu verileri sınıf büyüklüğü 10 olacak şekilde gruplandırarak bir frekans dağılımı teşkil ediniz. İlk sınıf olsun 50 den az puan alan öğrenci sayısını bulunuz. 70 veya daha yukarı puan alan öğrenci sayısını bulunuz. C şıkkındaki sınıflandırmaya göre her sınıfa ait sınıf değerini ve sınıf sınırlarını bulunuz C şıkkındaki sınıflandırmaya göre bir histogram ve frekans poligonu çiziniz. “..den az kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramı ve ojiv eğrinisini elde ediniz. “..den çok kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramını ve ojiv eğrisini elde ediniz. Selami ÖZCAN İstatistik

29 Selami ÖZCAN İstatistik
Çözüm1: 99-22=77 . c. Sınıf frekanslar d. 50 den az denildiği için =18 dir e. 70 ve daha fazla denildiği için =52 f. Sınıflar alt sınır üst sınır sınıf değeri/orta noktası , , ,5 , , ,5 g. Frekans 20 15 10 19,5 29,5 39,5 49,5 59, , , , ,5 h . “..den az küm.frekans 1, 7, 18, 30, 48, 64, 86, 100 “.. den çok küm.frekans 100, 99, 93, 82, 70, 52, 36, 14 den az den çok 100 75 50 25 22 45 51 61 65 71 77 84 88 93 33 53 62 72 89 35 47 54 66 73 79 37 48 55 85 95 39 49 56 63 67 74 80 57 64 68 81 86 76 91 96 42 69 87 97 43 50 58 70 82 99 Selami ÖZCAN İstatistik

30 Selami ÖZCAN İstatistik
Örnek 2: Yalova Termal otele 75 ay boyunca aylık gelen turistlerin sayısı aşağıdaki gibidir. Sınıf sayısı en az 8, en çok 15 olacak şekilde çetele tablosunu ve sınıflandırmayı ve sınıf orta noktasını bulunuz? 115 94 110 103 92 104 114 106 100 102 95 97 113 98 101 99 93 107 96 108 90 111 105 91 109 112 Selami ÖZCAN İstatistik

31 Selami ÖZCAN İstatistik
Sınıflar    Çetele    Frekans Sınıf Orta Noktası 90-92  ///   (90+92)/2=91 93-95   ///// =94 96-98    ///// ///   =97 99-101     ///// ///// //   =100    ///// ///// ////   =103   ///// ///// /  =106     ///// ////   =109     ///// ///   =112     /////     =115 Toplam     ÇÖZÜM2: Sınıflar 90-92 93-95 96-98 99-101 1. adım: Dağılımdaki en büyük ve en küçük değer bulunur. Örneğimizdeki en büyük değer 115, en küçük değer 90 2. adım: En büyük değerden en küçük değer çıkarılarak dağılım aralığı bulunur. Değişim aralığı = En büyük değer- En küçük değer  Dağılım aralığı= =25 3. adım: Dağılım aralığı bir kez 8'e bir kez 15'e bölünerek(sınıf sayısının en az 8, en çok 15 olmasını önerildiği için) sınıf aralığı saptanmaya çalışılır. 25÷8=3.1, 25÷15=1.6'dır. 1.6 ile 3.1 arasında herhangi bir değer sınıf aralığı olarak seçilebilir. Eğer sınıf aralığını 3 olarak alırsak yaklaşık 8-9 sınıf elde ederiz, sınıf aralığını 2 alırsak sınıf sayımız 12-13 arasında olur. Burada sınıf aralığı 3 olarak alınmıştır. Sınıflar şu şekilde En küçük değer 90 olduğundan ilk sınıfın alt sınırı 90 ile başlatılmıştır. Tüm sınıf sayımız ise 9'dur. Bütün değerler sınıflamaya dahil edilmiştir. 4. Adım: Sınıflar saptandıktan sonra her bir değerin hangi sınıfa gireceğine bakılır. Örneğimizdeki ilk değer 115'dir. Bu değer sınıfına gireceği için bu sınıfın karşısına bir çizgi çizilir. Sonra geri kalan değerler teker teker ait oldukları sınıfın karşısına işaretlenir. Buna "Çeteleme" denir. Sonra çeteleler sayılır ve her sınıfın karşısına yazılır. Örnek dağılımımızın çetele ve sayı ile gösterilmesi Selami ÖZCAN İstatistik

32 Selami ÖZCAN İstatistik
Frekans serisi ve gruplandırılmış seriye örnek (4 sınıflı gruplar oluşturulacak) Frekans serisi X frekans Top Gruplandırılmış seri Gruplar frekans Toplam Selami ÖZCAN İstatistik

33 Frekans serisinin gruplandırılmış seriye dönüşümü
Frekans serisinin gruplandırılmış seriye dönüşümü 1.adım: En yüksek X değerinden en düşük X değeri çıkarılır sınıf sayısına bölünür. (16-5)/4= 2,75 (sınıf büyüklüğü) bu değer serideki en küçük değer (5)e kümülatif olarak eklenir. 2. adım: örnekteki frekans seriyi eşit aralıklı 4 sınıflı sürekli gruplandırılmış bir seri haline getirelim. 5+2,75=7,75 olur. Sürekli gruplandırılmış seri kesikli gruplandırılmış seri (aralık 3) grup f grup frekans nisbi frekans ilk aralık 5-7, , 50-7, /40 7,75-10, ,75-10, /40 10,50-13, ,00-14, /40 13,25-16, ,25-17, /40 top top /40 Sınıf sınırları: 5-7,75;7,75-10,50;10,50-13,25;13,25-16,00 Sınıf büyüklüğü: ,00=2,75 Sınıf değeri: (5,00+7,75)/2=6,375 Selami ÖZCAN İstatistik

34 Kümülatif (Birikimli) Frekanslar
Bazı istatistiksel çalışmalarda bir frekans serisinde veya gruplandırılmış seride belirli bir değerden daha küçük veya daha büyük değer alan birim sayısının belirlenmesi gerekebilir. Bu durumlarda kümülatif frekanslar hesaplanır Her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan seriye KF denir. ..den az: küçükten büyüğe doğru oluşturulur. ..den çok: büyükten küçüğe doğru oluşturulur. Selami ÖZCAN İstatistik

35 Kümülatif Frekans Dağılımları
Sınıflar f 5-7, 7,75-10, 10,50-13, 13,25-16, 40 ..den az küm.f den çok küm.f. 7,75 den az ,00 den çok 10,50 den az = ,75 den çok =34 13,25 den az = ,50 den çok =14 16,00 den az = ,25 den çok = 3 ..den az küm.nisbi f. ..den çok küm.nisbi f. 7,75 den az /40=15 5,00 den çok /40=100 10,50 den az 26/40=65 7,75 den çok /40= 85 13,25 den az 37/40=92,5 10,50 den çok 14/40= 35 16,00 den az 40/40= ,25 den çok 3/40= 0,75 ..den az kümülatif Frekans dağılımları ..den çok kümülatif Frekans dağılımları ..den az küm.nisbi frekans dağılımları ..den çok küm.nisbi frekans dağılımları Sınıflar f 5-7, 7,75-10, 10,50-13, 13,25-16, 40 Selami ÖZCAN İstatistik

36 Selami ÖZCAN İstatistik
SORU 2015 verileri ile dünyadaki 30 büyük şehir nüfuslarına göre gruplandırılarak frekans dağılımları gösterilmektedir. Nüfus grupları(*1000 kişi) şehir sayısı(frekans) den az den az den az den az den az den az ve üzeri Yukarıdaki tabloyu kullanarak ; a. .. den az küm. frekans ve .. den çok küm. frekansları bulunuz? b. ..den az küm.nisbi ve ..den çok küm. nisbi frekansları bulunuz? c. Şehir nüfusu 6000 den az olan şehir sayısı kaçtır? d. Şehir nüfusu 8000 ve üzeri olan şehir sayısı kaçtır? e. Şehir nüfusu en az 5000 ve 8000 den az olan şehir nüfusu kaçtır? f. Histogram, frekans poligonu ve ojiv eğrilerini çiziniz? Selami ÖZCAN İstatistik

37 Selami ÖZCAN İstatistik
Çözüm a ve b şıkları den az den çok den az den çok Nüfus grupları(*1000 kişi) f küm. frekans küm.frekans küm.nisbi frekans küm.nisbi frekans den az /30= /30= /30= /30= /30= /30= /30= /30= /30= /30= /30= /30= ve üzeri /30= /30= c. Nüfusu 6000 den az şehir sayısı 16 dır. d. Nüfusu 8000 ve üzeri olan şehir sayısı 6 dır. e. Nüfusu 5000 ile 8000 den az olan şehir sayısı 18- 8=10 dur. f. Selami ÖZCAN İstatistik

38 BİLEŞİK SERİLER (Bağımlı/bağımsız)
Birimlerin birden fazla değişkene göre dağılımlarını bir arada gösteren serilerdir. Bir bileşik serinin ilk sütunu değişkenin gözlem değerleri, diğer sütunda ise ilgili değişkenlerin ilk değerleri yer alır. Birim seçimi (öğrenci) Değişken (uzunluk ve ağırlık) Örnek: Öğrenci gözlem no Uzunluk(m) X Ağırlık (kg) Y 1 1.72 68 2 1.68 70 3 1.80 76 4 1.74 73 5 1.76 71 Selami ÖZCAN İstatistik

39 SERİLERİN GRAFİKLE GÖSTERİLMESİ
HİSTOGRAM FREKANS POLİGONU Selami ÖZCAN İstatistik

40 Frekans dağılımların grafikle gösterilmesi
1.DİYAGRAMLAR (Çubuk ve alan grafikleri) Çubuk grafiği, gözlem değerleri x=2, 4, 6, 8, 10 yatay eksen Dikey eksende frekans değerleri: 2, 4, 7, 3, 1 2.FREKANS POLİGONU YATAY EKSEN DİKEY EKSEN BU KOORDİNAT SİSTEMİNE GÖRE OLUŞAN ŞEKİL Selami ÖZCAN İstatistik

41 Histogram ve frekans poligonu,
Histogram: dikdörtgenler dizisidir. Tabaları her bir sınıfın sınıf büyüklüğünü, yüksekliği ise frekansları gösterir Frekans Poligonu: dikdörtgenlerin üst kenarlarının orta noktaları birleştirilmek suretiyle elde edilen grafiğe denir. Başlangıç noktası ilk sınıftan bir önceki farazi sınıfın orta noktasıdır.bitiş ise son sınıftan sonraki farazi sınıfın orta noktasıdır. Her ikisinin kapsadığı alan birbirine eşittir. frekanslar histogram 20 15 Frekans poligonu 10 5 gruplar 5, , , , ,00 Selami ÖZCAN İstatistik

42 HİSTOGRAMA ve FREKANS POLİGONUNA ÖRNEK
Sınıflar Frekanslar (f) Sınıf aralıkları (h) Ayarlanmış frekanslar (f/h) 0-4 12 4 12/4=3 4-8 16 16/4=4 8-12 20 20/4=5 12-16 24 24/4=6 16-20 20-24 8 8/4=2 Frekans poligonu Ayarlanmış frekanslar 6 5 4 3 2 sınıflar Selami ÖZCAN İstatistik

43 Selami ÖZCAN İstatistik
Selami ÖZCAN İstatistik

44 VERİ ANALİZİ HİSTOGRAM:
FREKANS FREKANS FREKANS DEĞİŞKEN DEĞİŞKEN DEĞİŞKEN SİMETRİK HİSTOGRAM SAĞA ASİMETRİK HİSTOGRAM SOLA ASİMETRİK HİSTOGRAM Histogramlar; spesifikasyon ve sonuç arasındaki ilişkilerin araştırılmasında, normal olmayan verilerin belirlenmesinde, malzeme ve değişik verileri sınıflandırarak bir operasyonel-finansal sürecin içerisinde değişikliklere neden olan faktörlerin gözden geçirilmesinde kullanılmaktadır. 33

45 KÜMÜLATİF SERİLERİN GRAFİKLE GÖSTERİMİ
Sınıflar : 0-10, , , , , , , Frekanslar: 3, = 100 den az ve den çok serileri oluşturunuz? Sınıflar yatay, frekanslar dikey ekseni gösterir. den az = 3, 15, 40, 70, 85, 95, 100 den çok=100, 97, 85, 60, 30, 15, 5 ..den az 100 ..den çok 80 Selami ÖZCAN İstatistik

46 Bileşik serilerin grafikle gösterimi
Y X Selami ÖZCAN İstatistik

47 Selami ÖZCAN İstatistik
GRAFİKLER Araştırma sonucunda elde edilen ve düzenlenen verilerin daha kolay anlaşılabilmesi için gösterildiği şekillere grafik denir. Grafikler göze hitap ettikleri için, toplanan verilerin daha açık bir şekilde görülmesine ve yorumlanmasına yardımcı olur. Buradaki en önemli nokta grafiklerin açık ve anlaşılır biçimde çizilmeleridir. Selami ÖZCAN İstatistik

48 Verilerin grafikle gösterilmesi
Sütun/Bar grafiği Pasta grafiği Çubuk Çizgi Alan XY dağılımı Silindir Örnekler verilecek Radar grafiği Halka grafiği Hisse senedi Kabarçık Yüzey Koni grafiği Pramit grafiği Selami ÖZCAN İstatistik

49 Selami ÖZCAN İstatistik
BAR GRAFİK İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır. Selami ÖZCAN İstatistik

50 Selami ÖZCAN İstatistik
Diğer soru örnekleri Soru 1: Aşağıda 50 öğrencinin istatistik I dersinden aldığı notlar verilmiştir. Sınıf/Grup sayısı 10 olacak şekilde frekans tablosunu oluşturunuz? Selami ÖZCAN İstatistik

51 Selami ÖZCAN İstatistik
Soru 2: Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline gelen toplam 911 çağrının 36 günlük dağılımını göstermektedir Selami ÖZCAN İstatistik

52 Selami ÖZCAN İstatistik
Soru 3: Aşağıdaki 60 adet veriyi önce basit seriye sonra frekans serisine dönüştürünüz? 5,9 7,7 8,9 5,2 7,3 6,3 5,7 5,6 6,7 6,9 7 6,2 6,5 9,2 7,1 4,1 4,9 7,5 9,6 7,9 5,3 5,5 6,1 8,3 8,1 4,5 9,4 5,8 8,7 9,1 5,1 9,3 6 Selami ÖZCAN İstatistik

53 Selami ÖZCAN İstatistik
Soru 4: Bir fabrikada çalışan işçilerin aylık ücretleri ve bu ücreti alan işçilerin yüzde dağılımları şöyledir. Aylık Ücret (*100 tl) İşçi Yüzdesi den az , , , , , ,9 6000 – , ve üzeri ,6 Yukarıdaki tabloyu kullanarak ; a. 1.sınıf ne şekilde yazılmalıdır ki büyüklüğü 2.sınıfınkine eşit olsun? b. Aylık 4000 tl ve üzeri ücret alan işçilerin yüzdesi kaçtır? c. En az 3000 tl fakat 5000 tl den de az alan işçilerin yüzdesi kaçtır? d. Aylık ücreti 6000 den az olan işçilerin yüzdesi kaçtır? e. Yüzdeler toplamı neden %100 çıkmamıştır.? Selami ÖZCAN İstatistik

54 Selami ÖZCAN İstatistik
SORU 5 X yılı verilerine göre çalışanların çalışma statüleri aşağıda gösterilmiştir. Sütun/bar ve pasta grafiklerini çiziniz? Ücretli çalışanlar Mevsimlik/Yevmiyeli çalışanlar İşverenler Kendi hesabına çalışanlar Ücretsiz/aile işçisi Toplam Selami ÖZCAN İstatistik

55 Selami ÖZCAN İstatistik
Soru 6: 30 adet borunun et kalınlıkları mm olarak ölçülmüş sırasıyla aşağıdaki değerler bulunmuştur 4, , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,25 a. Sınıf sayısı 10 olacak şekilde sınıf aralığını bularak sınıfları oluşturunuz. b. Sınıf alt ve üst sınır uçları ile sınıf değerlerini bulunuz. c. Histogram ve frekans poligonunu çiziniz. Selami ÖZCAN İstatistik

56 Soru 7: İŞL 243 dersi ara sınav notları (n = 38)
a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını (2k > n  2k > 38  k = 6 (64 > 38) ve sınıf aralığını (max-min/ k) bulunuz c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz. Selami ÖZCAN İstatistik

57 Soru 8: İktisat 2. sınıfların yaşları aşağıdaki gibidir.(n=26)
a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını ve sınıf aralığını (max-min/ istenen sınıf sayısı) bulunuz c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz. Selami ÖZCAN İstatistik

58 Selami ÖZCAN İstatistik
ÜÇÜNCÜ BÖLÜM MERKEZİ EĞİLİM (YER) ve DEĞİŞKENLİK ÖLÇÜLERİ Selami ÖZCAN İstatistik

59 Selami ÖZCAN İstatistik
3. BÖLÜM: Sunum planı 1. Merkezi eğilim ölçüleri Parametrik Merkezi eğilim ölçüleri (Duyarlı) Aritmetik ortalama X Geometrik ortalama G Harmonik ortalama H Kareli ortalama K Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız) Mod Medyan Kantiller (kartiller, desiller, pörsentiller) 2. Dağılım / değişim ölçüleri Parametrik dağılım/değişim ölçüleri Değişim aralığı (Ranj) Kartil aralığı Desil aralığı Parametrik olmayan dağılım/değişim ölçüleri Ortalama sapma Varyans Standart sapma Değişim katsayısı Selami ÖZCAN İstatistik

60 Selami ÖZCAN İstatistik
1. Merkezi Eğilim Ölçüleri bir veri kümesinin ortasını belirleme eğiliminde olan sayısal değerdir. Gözlem değerlerinin etrafında toplanma eğilimi gösterdiği değerdir. Parametrik Merkezi eğilim ölçüleri (Duyarlı ortalamalar: serideki tüm gözlem değerlerinden etkilenen ortalamalardır.) Aritmetik ortalama X:Deneklerin aldıkları değerlerin toplanıp denek sayısına bölünmesiyle elde edilen değerdir Geometrik ortalama G= Harmonik ortalama H= Kareli ortalama K= Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar) Medyan (ortanca):Bir ölçek üzerinde orta noktanın yerini gösteren bu ölçü tüm değerleri ortadan ikiye bölen değerdir Mod:Ölçümlerde en fazla tekrar edilen değere mod denir Kantiller (kartil desil pörsentil) Ortalama kartil Parametrik merkezi eğilim ölçülerindeki ortalamaların değeri, serinin herhangi bir biriminin değeri değiştiğinde değişir. Yani değişikliklere duyarlı olan ortalamalar. Parametrik olmayan merkezi eğilim ölçülerindeki ortalamaların değerinin değişmesi için bu ortalamaların hesabında kullanılan birimlerin değerinin değişmesi gerekir. Selami ÖZCAN İstatistik

61 Selami ÖZCAN İstatistik
Aritmetik Ortalama ͞x Serideki bütün rakamlardan etkilenen ve en çok kullanılan ortalamadır. Özellikleri: Duyarlı bir ortalamadır, aşırı değerlerden etkilenir. Gözlem değerlerinin aritmetik ortalamadan sapmaların toplamı sıfırdır. (x-x)=0 Gözlem değerlerinin aritmetik ortalamadan sapmaların kareleri toplamı minimumdur.(x-x)²=min Selami ÖZCAN İstatistik

62 Basit Serilerde Aritmetik Ortalama: ͞x= Σx/n
Puan toplamlarının veri sayısına bölümüdür. Örnek Örnek 2: X X Top X=60/4= 35 26 23 Top: X=512/9=56,88 62

63 Selami ÖZCAN İstatistik
Frekans Serisinde Aritmetik Ortalama X f fx ͞x=Σfx/Σf X=69/10=6,9 Σf=10 Σfx=69 Selami ÖZCAN İstatistik

64 Gruplandırılmış Seride Aritmetik Ortalama
Gruplar Frekans Ort değ.(x) fx [(2+4)/4] Σf= Σfx=132 X=132/20=6,6 Selami ÖZCAN İstatistik

65

66 Selami ÖZCAN İstatistik
Tartılı Aritmetik Ortalama bir serideki değerler arasında önem derecesi farklı oluyorsa bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için önem düzeyini gösteren katsayılar (tartılar) kullanılır. Basit seride: Xt= Σtx/Σt frekans serisinde: Xt=Σtfx / Σtf Gruplandırılmış seride: Xt=Σtfm/Σtf Örnek: aşağıda öğrencinin almış olduğu dersler ve kredileri verilmiştir. Tartılı ortalamasını hesaplayınız. Dersler Not(X) Kredi(t) t X Üretim Yönetimi İstatistik İktisat Matematik Pazarlama Toplam Σt=15 Σtx=1162 tX=1162/15=77,47 Selami ÖZCAN İstatistik

67 Geometrik ortalama (G)
Örnek (basit) X=10,12,18,20 G=4√10x12x18x20=4√43200≈14.42 LogG=1/4 (log10+log12+log18+log20) LogG=1/4( =4.6355) Log G=1/4 (ΣlogX)=4,6355/4= x10 G=11.589 (Açıklama: Log G yi G ye çevirmek için logG yi 10 ile çarparız. Yani G=10 log G) Örnek (frekans) X=4,5,7, f=1, 2, 4, 3=10 Log X=0.6021, , , f. logX=(1x0.6021)+(2x0.6990)+(4x0.8451)+(3x0.9542) =8.2431 LogG=1/ Σf .(fxlogX)= /10=0,8243 Log G=1/10. ( )=8.2431 Log G= (1/Σf ). (fxLog X)=8.2431/10=0.8243 G=10 x =8.2431 Örnek (grup)2-4, 5-7, 8-10, 11-13 Sadece grupların orta noktası bulunarak yapılır. Serideki n tane birimin çarpımının n inci dereceden kökü alınarak hesaplanır. G=n√ x1.x2.x3…..xn (basit) logG=1/n(logx1+logx2+.logxn) G= Σf√X1f1 . X2f2. …Xnfn(frekans ve grup ) Log G=1/ Σf . [f1logX1 + f2logX2+ ….+log Xn] Selami ÖZCAN İstatistik

68 Selami ÖZCAN İstatistik
HARMONİK ORTALAMA (H) Serideki birimlerin çarpmaya göre terslerinin aritmetik ortalamaya göre tersleridir. Seride 0 veya negatif bulunması durumunda H hesaplanamaz H=n/Σ(1/x) basit seri için H= Σf/ Σ(f/x) frekans ve gruplandırılmış seri için Örnek: x=10, 12, 18, 20 basit seride harmonik ortalamayı bulunuz? 1/X=1/10+1/12+1/18+1/20= 0,1000+0,0833+0,0556+0,0500=0,2889 H=n/Σ(1/x) =4/0,2889= 13,85 Örnek: frekans serisinin harmonik ortalamasını bulunuz? X=4, 5, 7, 9 f=1, 2, 4, 3=10 H= Σf/ Σ(f/x)=10/(1/4+2/5+4/7+3/9)= H=10/( ,4000+0,5714+0,3333)=10/1,5547=6,43 Örnek: gruplandırılmış serinin harmonik ortalaması nedir? X=2-4, 5-7, 8-10, f=2, 13, 4, 1=20 önce ortalamalar bulunur. X= 3, 6, 9, 12 sonra f/x ler yani 2/3,13/6,4/9,1/12 H= Σf/ Σ(f/x)=20/(0,6667+2,1667+0,4444+0,0833)=5,95 Selami ÖZCAN İstatistik

69 Selami ÖZCAN İstatistik
KARELİ ORTALAMA (K) Seriyi oluşturan gözlem değerlerinin karelerinin toplamının gözlem sayısına oranının kare köküdür. K= √∑X²/n basit seriler için K= √∑fX²/ ∑f frekans ve grup serileri için Örnek: x=10, 12, 18, 20 basit serinin kareli ortalamasını bulunuz? X²= =968 K= √∑X²/n=√968/4=15.56 Örnek: X=4, 5, 7, 9 f=1, 2, 4, 3=10 frekans serisinin kareli ortalamasını hesaplayınız? K= √∑fX²/ ∑f frekans serisi ve gruplandırılmış seri için X²= = f X²=1x16+2x25+4x49+3x81=505 K= √∑fX²/ ∑f=√505/10=7.11 Örnek: Grup=2-4, 5-7, 8-10, f=2, 13, 4, 1=20 gruplandırılmış serinin kareli ortalamasını bulunuz? Önce orta nokta bulunur. X= 3, 6, 9, 12 sonra X² = 9, 36, 81, 144 f=2, 13, 4, 1=20 fx ² =2x9+13x36+81x4+144x1=954 K= √∑fX²/ ∑f= √954/20=6.91 Selami ÖZCAN İstatistik

70 Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar)
Duyarlı olmayan ortalamalar: seriyi oluşturan tüm gözlem değerlerinin büyüklüklerinden etkilenmeyen ortalamalardır. Medyan Mod Kantiller Kartiller Desiller Pörsentiller Selami ÖZCAN İstatistik

71 MEDYAN (Orta Değer, Ortanca)
Büyükten küçüğe, küçükten büyüğe doğru sıraladığımızda tam ortaya düşen değer (iki değerin ortalaması) seriyi iki eşit parçaya bölen gözlem değeridir. N=toplam frekans, basit ve frekans serilerinde (N+1)/2 medyandır. Gruplandırılmış seride kaçıncı değerin medyan olduğunu bulmak için “.. den az kümülatif frekanslar bulunur. (N+1)/2 değerinin içerisinde yeraldığı kümülatif frekans gruplandırılmış seride medyan sınıfını ifade eder. Frekans ve gruplandırılmış serilerde çok sayıda değer olacağı için 1 dikkate alınmayabilir. Yani N/2 olur. N/2=medyanı gösteren değer L=medyan sınıfının alt sınırı N=toplam frekans (∑f) fm-1=medyan sınıfına kadar sınıfların frekansları toplamı fm=medyan sınıfının frekansı hm=medyan sınıfının büyüklüğü Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir. Selami ÖZCAN İstatistik

72 Basit seride medyana örnek
tek sayı ise: ham veri: 2,2,3,7,4,5,6 basit seri: 2,2,3,4,5,6,7 (4 medyan) çift: 10, 12, 8, 4, 9, 3 sırala 3, 4, 8, 9, 10, (8+9)2=8,5 medyan Örnek (çift) X N=(4+1)/2=2,5 yani 2. ve 3. değerlerin ortalaması 12+18/2=15 medyan 10 12 18 20 Selami ÖZCAN İstatistik

73 Frekans serisinde Medyana Örnek
Örnek 1: tek ise: x=2,4,6,8,10 f=2,4,3,5,1= /2= 7.5 frekansa karşılık gelen X değeri medyandır. küm.f=2, 6, 9,14, 15= 7,5 değeri 6’dan büyük olduğu için frekansı 9 olan x değeri 6 medyandır. Örnek 3: çift ise X=4,5,7,9 f=1,2,4,3 küm.f=1,3,7,10 N+1/2 yani 10+1/2=5,5 değer medyandır. 5,5 değer 5 ten büyük olduğu için bir sonraki değer olan 7 nin içinde yer alır. Küm.frekansı 7 olan 7 değeri medyandır. Örnek 3: Selami ÖZCAN İstatistik

74 Gruplandırılmış seride medyan formülü ve notasyonları
Formuldeki notasyonlar N/2=medyanı gösteren değer L=medyan sınıfının alt sınırı N=toplam frekans (∑f) fm-1=medyan sınıfına kadar sınıfların frekansları toplamı fm=medyan sınıfının frekansı hm=medyan sınıfının büyüklüğü Çok sayıda değer olacağı için sınıflama/gruplama yüzünden yaklaşık medyan değeri bulunur. Selami ÖZCAN İstatistik

75 Örnek 1: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz?
X f küm.f. ..den az küm.f. .den çok küm.f =20 20/2=10 Küm.Frekans 20 15 10 5 Çözüm 2: Grafik metodu: ”..den az ve ..den çok” değerleri aynı grafikte gösterilirse x eksenindeki kesişim noktası medyandır. Çözüm 1: 10. Değer 15 frekansın içindedir. Küm frekans= sınıfı göstermektedir. Alt sınır:4,5 Üst sınır:7,5 büyüklüğü 3 tür. Medyan sınıfının bir önceki küm.frekansı 2, Medyan sınıfının frekansı:13 tür. Medyan:4,5+[(10-2)/13 ]x3=6,35 3 6 9 12 15 6,35 Gruplar Selami ÖZCAN İstatistik

76 Örnek 2: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz?
X f küm.frekans =22 22/2=11 ..den az serisinin 11. gözlem değeri sınıfı medyan sınıfıdır. L=18, N/2=11 fm-1=7 fm=8 hm:4 Medyan: 18+ [(11-7)/8] x 4=20 medyan sınıfının içinde yer alıyor. Selami ÖZCAN İstatistik

77 Örnek3: Aşağıdaki dağılımın ortalama ve medyan değerini hesaplayın.

78 Selami ÖZCAN İstatistik
Örnek 4: işletme 2. sınıf öğrencilerinin yaşlarının oluşturduğu sınıf ve frekansları aşağıdaki gibidir. Dağılımın ortalama ve medyan değerini bulunuz? Selami ÖZCAN İstatistik

79 Selami ÖZCAN İstatistik
Diğer örnekler (35+1/2= nin içinde grup medyan sınıfı) {[(35/2)-14] /6}x3=56,25 medyan Selami ÖZCAN İstatistik

80 Sınıflandırılmış/Gruplandırılmış serinin grafikle gösterimi
k.f. Grafik Metodu ile Medyan “..den az kümülatif frekans eğrisinin kesiştiği noktasındaki X değeridir. 20 Medyan değeri: 6.15 15 10 5 Gruplar 3 6 9 12 15 Selami ÖZCAN İstatistik

81 Mod (Tepe Değer) Mod ya da tepe değer, bir seride (puan dağılımında) en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Tepe Değer (Mod) ile ilgili bazı önemli noktalar Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur. Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur.Dizinin modu 4 3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu bulunmaktadır. Bir sayı setinde elemanların hepsi birbirinden farklı ise bu basit serinin modu yoktur. Basit seriye Örnek1: 60,72,82,72,61,81,72 ise Mod=72’dir. Örnek 2: x=1,1,2,1,3,2,2,1,1,3,5,4,1,1,2 en çok tekrar edilen 1 modtur. Örnek 3: 5, 7, 12, 28, 40, 35 mod yoktur Örnek 4:10,12,18,20 mod yoktur. Frekans seriye Örnek 1: X=2,3,4,5 f=2,4,7,1 en büyük frekans 7, mod değeri ise 4 Örnek 2: x=4,5,7,9 f=1,2,4,3 frekansı (4) en yüksek x değeri 7 modtur. Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. 81 81

82 Sınıf/Gruplandırılmış Serinin Modu Örnek 1
Mod:en büyük frekans bir gözlem değerine değil, bir sınıfa karşılık gelmektedir. Bu sınıfa mod sınıfı denir Sınıf/Gruplandırılmış Serinin Modu Örnek 1 Örnek 1: Gruplar=2-4, 5-7, 8-10, frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 Mod: 4,5+11/(11+9) x 3= 6,15 Örnek 2: L = mod sınıfının alt sınırı ∆1= mod sınıfı frekansı ile ondan bir önceki sınıfın frekansları arasındaki mutlak fark ∆2= mod sınıfının frekansı ile ondan bir sonraki sınıfın frekansları arasındaki fark hm= sınıf aralığı, mod sınıfının sınıf büyüklüğü Selami ÖZCAN İstatistik

83 Örnek 1’in Grafik Metodu ile Çözümü
Gruplar=2-4, 5-7, 8-10, frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 Mod: 4,5+11/(11+9) x 3= 6,15 Frekans 15 10 5 1, , , , ,5 Gruplar Mod:6,15 Selami ÖZCAN İstatistik

84 Selami ÖZCAN İstatistik
Örnek 3 ve 4 Mod değerinin mod sınıfı içinde kaldığına dikkat ediniz. Birden fazla aynı değerde frekans varsa iki yada daha çok gözlem değeri veya sınıf bulunabilir. İlgili frekans serisi sınıflandırılarak , sınıflandırılmış seri ise farklı bir sınıf aralığında yeniden sınıflandırılmalıdır. Örnek 4: frekans Yeniden sınıflandırılır Toplam Mod:30+(29/(29+3)) x 20=48, Toplam 100 Örnek 3: Sınıflar Frekans Küm.frekans Toplam L=18, ∆1= 7-4=3 , ∆2= 7-5=2 hm=4 Selami ÖZCAN İstatistik

85 Ortalamalar arasındaki ilişki
Simetrik Sağa eğik Sola eğik X Mod Medyan Mod Medyan X X Mod Medyan X > Medyan > Mod Mod > Medyan > X Mod=Medyan= X Selami ÖZCAN İstatistik

86 86

87 Dağılımda Çarpıklık: Negatif Çarpık Dağılım
Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama<Medyan<Mod. Sorular ve test kolaydır. 87

88 Dağılımda Çarpıklık: Pozitif Çarpık Dağılım
Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod<Medyan<Ortalama. Sorular ve test zordur. 88

89 89

90 KANTİLLER KARTİLLER, DESİLLER, PÖRSENTİLLER
1. Kartiller: büyüklük sırasına konulmuş bir seriyi 4 eşit parçaya böler.Bir seride 3 kartil bulunur. 2. kartil medyandır. Q1, Q2, Q3 ile gösterilir. Basit ve frekans serisinde kartil: Q3=3x(N+1)/4 Q1=N+1/4 Q2=2x(N+1)/4 Sınıf/gruplandırılmış serilerde kartil: Q1=L+[(N/4)-∑f/fQ1 ] x hm Q2=L+[(2.N/4)-∑f/fQ2 ] x hm Q3=L+[(3.N/4)-∑f/fQ3 ] x hm 2. Desiller =D9, D1 dir. (seriyi 10 eşit parçaya böler) Basit ve frekans serisinde desiller: D3=3x(N+1)/10 D1=N+1/10 D2=2x(N+1)/10 Grup serilerde desiller: D1=L+[(N/10)-∑f/fD1 x hm D2=L+[(2.N/10)-∑f/fD2 x hm D3=L+[(3.N/10)-∑f/fD3 x hm 3. Pörsentiller =D99-D1 dir. (seriyi 100 eşit parçaya böler) Basit ve frekans seride Pörsentiller: P3=3x(N+1)/100 P1=N+1/100 P2=2x(N+1)/100 Grup serilerde pörsentiller: D1=L+[(N/100)-∑f/fP1 x hm P2=L+[(2.N/10)-∑f/fP2 x hm P3=L+[(3.N/100)-∑f/fP3 ] x hm Selami ÖZCAN İstatistik

91 2. Dağılım/Değişkenlik Ölçüleri
Dağılım / değişim ölçüleri Parametrik dağılım/değişim ölçüleri Değişim aralığı (Ranj) Kartil aralığı Desil aralığı Parametrik olmayan dağılım/değişim ölçüleri Ortalama sapma Varyans Standart sapma Değişim katsayısı Selami ÖZCAN İstatistik

92 Parametrik olmayan dağılım/değişim ölçüleri
Değişim aralığı (Ranj) Kartil aralığı, yarı kartil aralığı Desil aralığı, yarı desil aralığı Selami ÖZCAN İstatistik

93 Değişim Aralığı (Ranj):DA
En büyük ölçümle en küçük ölçüm arasındaki farktır. gruplandırılmış serilerde en yüksek sayıdan en küçük sayının çıkarılması ile bulunur. DA serinin değişkenliği hakkında zaman kaybetmeden genel bilgi verir. Dezavantajı:serideki bütün birimlerin hesaplamaya girmemesi sadece iki değerle hesaplamanın yapılması, aşırı değerlerin direkt etkisindedir. DA= Xmax-Xmin Örnek: basit seri: X=30,32,35,36,37 y=2,14,20,44,90 DA(x)=37-30=7 DA (y)=90-2=88 Örnek: Frekans serisi x:4,5,7,9 f:1,2,4,3 DA=9-4:5 Örnek: sınıflandırılmış seri: sınırlar:1-3,3-5,5-7,7-9 f=1,2,4,3 DA:9-1:8 Selami ÖZCAN İstatistik

94 Ranj (Değişim Aralığı) Örnek
Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=? Ranj (DA)= 61-59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? Ranj (DA)= 90-30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar. 94

95 Selami ÖZCAN İstatistik
Kartil (çeyrek sapma) Aralığı Desil (onda bir sapma) Aralığı Pörsentil (yüzde 1 sapma)Aralığı Kartil aralığı 3. kartilden 1. kartil çıkarılarak bulunur. En büyük ve en küçük %25 dikkate alınmadığı için Değişim Aralığına göre uç değerlerden daha az etkilenir. Dezavantajı hesaplamaya bütün değerlerin katılmaması Kartil Aralığı= Q3-Q1 dir. Yarı Kartil Aralığı=(Q3-Q1)/2 (seriyi 4 eşit parçaya böler) Desil Aralığı=D9-D1 dir. Yarı Desil Aralığı=(D9-D1)/2 (seriyi 10 eşit parçaya böler) Pörsentil Aralığı=D99-D1 dir. Yarı Pörsentil Aralığı=(D99-D1)/2 (seriyi 100 eşit parçaya böler) Selami ÖZCAN İstatistik

96 Kartil: Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur. 96 96

97 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25)
Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: 15,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80,84 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y75)= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma  (65-25)/2=20 olur. 97 97

98 Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir. 98 98

99 Aralığın Gerçek Sınırı
Örnek: Çeyrek Sapma Puan Aralığı f Toplamalı Frekans Aralığın Gerçek Sınırı 21,00-25,00 1 20,50-25,50 26,00-30,00 2 25,50-30,50 31,00-35,00 4 30,50-35,50 36,00-40,00 6 10 35,50-40,50 41,00-45,00 16 40,50-45,50 46,00-50,00 7 23 45,50-50,50 51,00-55,00 24 50,50-55,50 99

100 100 100

101 101 101

102 Parametrik dağılım/değişim ölçüleri
Paremetrik olmayan dağılım ölçüleri serideki bütün değişkenleri dikkate alarak ölçmesi, fakat paremetrik dağılım ölçülerinde ise serideki rakamların aritmetik ortalamadan sapmalarını dikkate alır. Ortalama sapma Varyans Standart sapma Değişim katsayısı Selami ÖZCAN İstatistik

103 Selami ÖZCAN İstatistik
Ortalama Sapma Serideki rakamların aritmetik ortalamadan farklarının toplamı sıfırdır. Ortalamadan farkların bir kısmı negatif bir kısmı pozitiftir. Toplarsan sıfır olur. Hesaplama mutlak değerlerin toplamı rakam sayısına bölündüğünde os bulunur. Formül yandaki gibidir. Medyan etrafındaki ortalama sapmanın minimum olmasıdır. Basit seride Frekans serisinde Sınıflandırılmış/gruplandırılmış seride Selami ÖZCAN İstatistik

104 Selami ÖZCAN İstatistik
Varyans Aritmetik ortalamanın özeliklerinden biri ∑(x-͞x)²=minimum olmasıdır. Fark karelerin toplamını serideki rakam sayısına böldüğümüzde varyans elde edilir. Örnek sayısı büyüdükçe n ile n-1 arasında fark kalmaz. Selami ÖZCAN İstatistik

105 Selami ÖZCAN İstatistik
Standart Sapma Örnek2: 78,89,56,36,48,92,59,60=S=19.8 Standart Sapma: Ölçümlerin ortalamadan olan farklarının karelerinin ortalamasının kareköküdür. Standart sapma varyansın pozitif kareköküdür. Standart hata: Aritmetik ortalamada oluşan hatanın belirlenmesi için bulunur. Örnek1: basit seri x=1,4,5,7,9,10 ͞x=36/6=6 (x-͞x)=1-6,4-6,5-6,7-6,9-6,10-6 = -5,-2,-1,1,3,4= (x-͞x)²=25,4,1,1,9,16=56 Selami ÖZCAN İstatistik

106 Frekans Serilerde Standart Sapma
X f x.f x-͞x (x-͞x)² (x-͞x)². f 4 1 -3,25 10,5625 6 3 18 -1,25 1,5625 4,6825 7 42 -0,25 0,0625 0,375 8 32 0,75 0,5625 2,25 10 2 16 20 116 2,75 7,5625 15,125 33 Frekans serisinin ortalaması X=∑x.f / ∑f=116/16=7,25 Frekans serisinin standart sapması Selami ÖZCAN İstatistik

107 Gruplandırılmış seri(orta noktalar bulunur veya (kodlama metodu)
Gruplar f u=kod f. u f . u 10-14 6 -2 -12 4 24 15-19 -1 -6 1 20-24 10 25-29 9 30-34 Toplam 40 2 18 36 75 Selami ÖZCAN İstatistik

108 Standart sapma ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir.
Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır. ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir. 108

109 Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır: 109

110

111

112 Standart Sapmanın Özellikleri
SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. Negatif değerler almaz. Veri grubundaki tüm değerler aynı ise SS sıfırdır. SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir. 112 112

113 Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki
Aritmetik ortalama ile standart sapmanın arası büyürse, Heterojen yapı oluşur ve grup başarısı düşer. Aritmetik ortalama ile standart sapmanın arası küçülürse, Homojen yapı oluşur ve grup başarısı artar. Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe, Standart sapmada büyür. Bir testten elde edilen puanların standart sapması büyüdükçe, Testin güvenirliği artar. 113

114 Standart Hata Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. 114 114

115 Selami ÖZCAN İstatistik
Değişim Katsayısı: DK Aynı seri farklı ölçü birimleriyle farklı standart sapmaya sahip olabilir, farklı ölçü birimleriyle hesaplanan iki ayrı serinin mukayesesi de doğru değildir. Bu olumsuzlukları gidermek için değişim katsayısı geliştirilmiştir. Mutlak değişkenlik ölçüleri,seriyi oluşturan gözlem değerlerinin büyüklüklerinin de etkisi altındadır. Mutlak değişkenlik yerine nispi değişim/dağılım esas alınmıştır. Standart sapma aritmetik ortalamanın yüzdesi olarak ifade edilmiştir. DK=(s/ ͞X) x 100 Ortalaması 15, standart sapması 4,76 olan serinin DK ne olur? DK:(4,76/15) x 100=%31,73 x=10,11,13,14,17/65 (͞x=13, ss=2,7386) y=43,48,58,63,73/285 (y=57 ss=11,9373) ssx küçük ssy. DKx=2,7386/13 x 100=%21,066 DKy=11,9373/57 x100=%20,9426 X serisindeki değişkenlik y serisine göre daha fazladır. Selami ÖZCAN İstatistik

116 BÖLÜNMENİN ŞEKLİNE GÖRE OLUŞAN ÖLÇÜLER
Şu ana kadar serilerdeki ortalama ve değişkenliği inceledik, bu yetmez. Bölünme şeklini ortaya koyan ölçülere de ihtiyaç vardır. Seriler: simetrik (X=Med=Mod) veya asimetrik (X>Med>Mod sağa çarpık seri ve X<Med<Mod sola çarpık seri) bölünür. Aritmetik ortalama ile mod veya medyan arasındaki fark pozitif ise sağa çarpık, negatif ise sola çarpık denir. Seriler: normal, sivri ve basık serilerden birine göre de bölünebilir. Bölünme şekline göre oluşan ölçüler, Momentler, Çarpıklık ve Basıklık

117 Bölünme şekline göre oluşan ölçüler,
Momentler, Çarpıklık ve Basıklık Selami ÖZCAN İstatistik

118 MOMENTLER Ortalamalara (kantillere) dayanan asimetri ölçüsü yaklaşık bir değerdir. Asimetriyi daha duyarlı ölçmek için momente dayanan ölçüm yapılması gerekir. Sıfıra (x-0=xi) veya aritmetik ortalamaya (x-xort) göre sapmaların tamamına moment denir. Bir seride sıfır (aritmetik ortalama) etrafındaki r. Momente (µr.) Momenti denir. Mr=£Xʽ/n (0 için basit serinin momenti) Mr=£(X-Xort)ʽ/n (Xort için basit serinin momenti) µr=£fxʽ/£f (0 için frekans ve gruplandırılmış serinin momenti) µr= £f(x-xort)ʽ/£f (Xort için frekans ve gruplandırılmış serinin momenti) Sıfır etrafındaki 1.Moment aritmetik ortalamaya eşit, 2.momentin karekökü kareli ortalamaya eşittir. M1=0, M2=S²(varyans) µ2=M2-M²1 µ 3= M3-3M1M2+2M³1 µ 4= M4-4M1M3+6M²1M2-3M‘1 Örnek: x=10,12,18,20 serinin(0 ve xort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm: X=10, 12, 18, 20 =60/4=15 X²=100,144,324,400=968 M2=968/4=242 X3=1000,1728,5832,8000=16560 M3=16560/4=4140 X-Xort=10-15,12-15,18-15,20-15=-5,-3,3,5 (X-Xort)²=25, 9, 9, 25=68 M2=68/4=17 (X-Xort)3=-125, -27, 27, 125=0 M3=0/4=0 µ2=M2-M²1 =242-15²=17 µ 3= M3-3M1M2+2M³1 =4140-3(15).(242)+2.(15)³=0 µ 4= M4-4M1M3+6M²1M2-3M‘1

119 Gruplandırılmış Serinin Moment hesabı
Örnek: Gruplar=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3=10 serinin (0 ve xort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm: önce sınıf orta noktaları bulunur. X=2, 4, 6, 8 f=1, 2, 4, 3 = Xort=58/10=5,8 X²=4,16,36,64= X³=8,64,216,512 f.X=2,8,24,24=58 f.X²=4,32,144,192=372 f.X³=8,128,864,1536=2536 (X-Xort)=(2-5,8)=-3,8 (4-5,8)=-1,8 (6-5,8)=0,2 (8-5,8)=2,2 (X-Xort)²=14,44 3,24 0, ,84 (X-Xort)³= -54, , , ,648 f.(X-Xort)²=14, ,48 0, ,52 =35,60 f.(X-Xort)³=-54, , , ,944 = - 34,560 µ2=M2-M²1 =37,2-(5,8)²=3,56 µ3= M3-3M1M2+2M³1 =253,6-3(5,8).(37,2)+2.(5,8)³=-3,456

120 ÇARPIKLIK (Asimetri) Bir serinin simetriden ayrılmasıdır. Rakamların dağılımı her zaman simetrik olmaz. Dağılım sağa ve sola çarpık olabilir. Serideki asimetriyi çarpıklık katsayısı ile ölçeriz. Çarpıklık katsayısı 0’a eşit olduğunda dağılım simetriktir. Çarpıklık katsayısı negatif olduğunda sola çarpık, pozitif olduğunda sağa çarpık olur. Çarpıklık katsayıları 3 e ayrılır. Pearson Çarpıklık Katsayısı Kartil Çarpklık Katsayısı Moment Çarpıklık Katsayısı

121 Pearson Çarpıklık Katsayısı
Pearson ortalamalar arasındaki şu ilişkiyi fark etmiştir. Xort-Mod≈3(Xort-Medyan) Her iki tarafı standart sapmaya bölerek bu ifadeleri ölçü biriminden bağımsız hale getirmiştir. Çarpıklık=3(Xort-Medyan) / standart sapma Çarpıklık=(Xort-Mod) / standart sapma Not: bu katsayı sıfıra eşit ise dağılım simetrik, büyükse sağa çarpık, küçükse sola çarpıktır. X=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3 kf=1, 3, 7, 10 Medyana dayalı çarpıklık için aritmetik ortalama ve standart sapmayı bilmek gerekir. Aritmetik ortalama:5,8 2.Moment ise 3,56 (varyanstır) Standart sapma=√3,56≈1,89 N=10 10/2=5. değer medyandır. Medyan 5-7 sınıfı Yaklaşık medyan değeri=5+[(5-3)/4].2=6 dır. Medyana dayalı çarpıklık= 3(xort-medyan)/standart sapma Medyana dayalı çarpıklık= 3(5,8-6)/1,89 ≈-0,32 Mod=L1+[∆1/ (∆1+ ∆2)].c =5+[2/(2+1)]2=6,33 Moda dayalı çarpıklık= =(Xort-Mod) / standart sapma= Moda dayalı çarpıklık 5,8-6,33 / 1,89= -0,28 Seri sola çarpıktır.

122 Kartil Çarpıklık Katsayısı
Herhangi bir dağılıma ait kartil değerleriyle de asimetrik dağılım olup olmadığına karar verilebilir. Kç=(K3-K2)-(K2-K1) / K3-K1 Kç=(K3-2K2)+K1 / K3-K1 Örnek: (pearsen örneğinin devamı) medyan 6, medyan 2. kartile eşittir.1. ve 3. kartili tespit etmek gerekir. Sonra çarpıklığa bakılır. K1 için N/4 10/4=2,5 değer 1.kartildir. Kümülatif frekansı 3 olan 3-5 sınıfı 1.kartil sınıfıdır. K3 için 3N/4=3x10/4=7,5 değerdir. Sınıfı 7-9 sınıfıdır. K1=3+ [(2,5-1)/2].2=4,5 K3=7+[(7,5-7)/3].2=7,33 Buna göre Kartil çarpıklık katsayısı şu şekilde bulunur. Kç=(K3-2K2)+K1 / K3-K1 Kç=(7,33-2x6+4,5) / (7,33-4,5) =-0,06 Negatif çıktığı için seri sola çarpık demektir.

123 Moment Çarpıklık Katsayısı
Ortalama etrafındaki 3. momentin standart sapmanın 3. kuvvetine bölünmesiyle elde edilir. α3=µ3 /s³ Simetrik dağılımlarda moment çarpıklık katsayısı 0 dır. α3>0 ise sağa çarpık, α3<0 ise sola çarpıktır. Örnek1: 2.moment 17 ve 3. moment 0 dır. Aritmetik ortalama etrafındaki 2. moment, varyans ve bunun karekökü de standart sapmaya eşittir. Standart sapma=4,12 Bu dağılıma ait moment çarpıklık katsayısı=0/(4,12)³=0 Sonuç, katsayı 0 olduğu için dağılım simetriktir. Örnek 2= aritmetik ortalama etrafındaki 2. moment 3,56 (varyans)(standart sapma varyansın karekökü yani 1,89) ve 3.moment -3,456 ise moment çarpıklık katsayısı nedir? α3=µ3 /s³=-3,456/(1,89)³=-0,51 (sola çarpıktır.)

124 BASIKLIK (momente dayanan basıklık ölçüsü)
Örnek1: X=10,12,18,20 =60/4=15 (basit) Çözüm: (X-Xort)=-5, -3, 3, 5 (X-Xort)4=625, 81, 81, 625=1412 ά4 = µ4/S4 =>µ4 =1412/4=353 S4=(17)²=144 ά4 =353/144=1,22 < 3 ten küçük olduğu için dağılım normale göre basıktır. Örnek2: X=2,4,6, f=1,2,4,3 =10 (frekans) Çözüm: (X-Xort)= -3,8 -1,8 0,2 2,2 (X-Xort)4=208, , , ,4256 f . (X-Xort)4=208, , , ,2768 =299,7920 µ4 =299,792/10=29,9792 S4=(3,56)²=12,6736 ά4 =29,9792/12,6736=2,37 < 3 olduğundan seri normale göre basıktır. Yani dağılımın değişkenliği normal dağılımın değişkenliğine göre fazladır. Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir. ά4 =3 olursa yükseklik normal ά4 ≥3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά4 ≤3 dağılım basıktır(dağılımda değişkenlik fazla). S4=(µ2)² Ör: bir önceki örnekte aritmetik ortalama etrafındaki 2. moment µ2=17 ve µ2=3,56 olarak hesaplanmıştı önce aritmetik ortalama etrafındaki 4. momenti bulunuz. Sonra moment basıklık katsayısını bulunuz.

125 Selami ÖZCAN İstatistik
BASIKLIK Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir.ά4 =3 olursa yükseklik normal ά4 ≥3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά4 ≤3 dağılım basıktır(dağılımda değişkenlik fazla). Ör: Selami ÖZCAN İstatistik

126 Çarpıklık Katsayısı Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir. 126

127 Dağılımın Basıklığı

128 Selami ÖZCAN İstatistik
DÖRDÜNCÜ BÖLÜM İHTİMAL HESABI Selami ÖZCAN İstatistik

129 Selami ÖZCAN İstatistik
4. BÖLÜM: Sunum planı Deney, sonuç ve örneklem uzay Olasılık (ihtimal) Olasılık(ihtimal) Hesaplama Sayma ve Ayrılık olayları Çarpma Kuralı Toplama Kuralı Beklenen değer (matematik ümit) Bazı kurallar Selami ÖZCAN İstatistik

130 Selami ÖZCAN İstatistik
GİRİŞ Meteroroloji uzmanı: %80 ihtimalle yağmur yağacağını Sağlık uzmanı sigara içenlerin içmeyenlere oranla daha çabuk kansere yakalanacağını İhtimal tahlil edici, çıkarımsal istatistiktir. Satış tahminleri Selami ÖZCAN İstatistik

131 DENEY, SONUÇ VE ÖRENLEM UZAY
Deney: pek çok gözlemden sadece bir tanesinin gerçekleşmesi sürecine deney denir. Deneyin sonuçları: bu gözlemlere deneyin sonuçları denir. Örneklem uzay: bu sonuçların tümüne ise deneyin örneklem uzayı denir. Örneklem uzay S ile gösterilir. s= (hatalı, hatasız) Örneklem noktaları: örneklem uzayın elemanlarına örneklem noktaları denir. Deney Sonuç Örneklem uzay Vida inceleme Hatalı / hatasız S=(hatalı, hatasız) Paranın bir kez atılması Yazı tura S=(yazı, tura) Paranın iki kez atılması YY,YT,TT, TY S=(YY,YT,TT,TY) Zarın bir kez atılması 1,2,3,4,5,6 S=(1,2,3,4,5,6) Doğacak bebeğin cinsiyeti Erkek, kız S=(kız, erkek) Öğrencinin yarıyıl sonuçu Başarılı, başarısız S=(başarılı, başarısız) Selami ÖZCAN İstatistik

132 Örneklem Uzay/ örnek uzayı s=(Y,T)
Venn Şeması: bir deneyin tüm muhtemel sonuçlarının kare, dikdörtgen veya daire ile gösterilmesine denir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) venn şeması ile gösterilmesi Ağaç diyagramı: her bir sonucun ağacın bir dalı ile ifade edilmesidir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) ağaç diyagramı ile gösterilmesi Nihai Sonuçlar Y Yazı Y. T. Tura T Selami ÖZCAN İstatistik

133 Selami ÖZCAN İstatistik
BASİT VE BİLEŞİK OLAY Olay: bir deneyin bir veya daha çok sonucundan oluşur. Olay basit (elementer) ve bileşik (katışık) olay şeklinde gerçekleşmektedir. Basit olay: herhangi bir deneyin nihai sonuçlarına denir. Basit olay sadece ve sadece bir tane sonuç içermekte Ei biçiminde gösterilir. Örnek: bir işyerinde çalışan personel arasında rastgele iki tanesinin seçildiği ve cinsiyetlerinin(erkek, kadın) kaydedildiği düşünülsün bu deneyin tüm sonuçları: E1(EE), E2(KE), E3(EK), E4(KK) bu dört durumdan her biri basit olaydır. Yarın yağmur yağması ihtimali, tek sonuç Sınıfta gözlüklü öğrenci olması ihtimali tek sonuç Bileşik (katışık) olay: iki veya daha fazla sonucun yani birden çok sonuçtan oluşmaktadır. A1, A2, A3,… veya B1, B2, B3, B4, B5,….Bn şeklinde gösterilir. Birarada meydana gelen,birbirini engelleyen olaylr Örnek1: bir işyerinde çalışan personel arasında rastgele iki tanesinin seçildiği ve cinsiyetlerinin(erkek, kadın) kaydedildiği düşünülsün bu A olayının en çok bir erkeğin seçilmiş olduğunu venn şemasında gösteriniz? Bileşik olay: iki durum: istenen en çok bir erkek olması: EK, KE, KK, ikinci durum istenmeyen: EE Örnek2: bir grup insan kainatın yaratıcısına inanıyor ve yaratıcıyı kabul ediyor, geri kalanı inanmamakta ve karşı çıkmaktadır. Bu gruptan rastgele iki kişi seçilmiş ve kainatın yaratıcısı hakkında görüşleri sorulmuş. Kaç farklı sonuç söz konusudur. En çok bir kişinin inanmıyor olma durumu nedir. İ:inanıyor, K:karşı çıkıyor/inanmıyor İİ: her ikisi de inanıyor. KK: her ikisi de inanmıyor. İK: biri inanıyor, biri inanmıyor.Kİ:biri inanmıyor, biri inanıyor. 4 farklı durum söz konusudur, birden çok sonuç var. Bileşik olaydır. İİ, İK, Kİ üç durum söz konusudur. Selami ÖZCAN İstatistik

134 Selami ÖZCAN İstatistik
Basit ve bileşik olay örneklerinin Venn şeması ve Ağaç diyagramı gösterimi EE A EK. İİ İ KE. KK. İK K İ İ K İİ İK. Kİ KK. K KK A B A∩B AUB Selami ÖZCAN İstatistik

135 Selami ÖZCAN İstatistik
İhtimal Hesaplama İhtimal/Olasılık (Probability): bir olayın meydana gelme sansının sayısal ölçüsüdür. N birim ihtiva eden ana kütleden belli bir x özelliğini taşıyan n tane birim varsa bu ana kütleden rastgele bir birim alındığında bu birimin x özelliğini taşıması durumudur. P(x)=n/N şeklinde hesaplanır. Ei ile basit olayın ihtimali (P(Ei)dir. A ile bileşik olayı ihtimalı P(A) ile gösterilir. İhtimal (Olasılık) İki Temel Özelliği 1. Bir olayı meydana gelmesi ihtimali 0 ile 1 arasında değişir. Olay ister basit, ister bileşik olsun ihtimali sıfırdan küçük birden büyük olamaz. 0≤P(Ei) ≤ ≤P(A) ≤1 P(x)=n/N=0 ise söz konusu olayın meydana gelmesi (imkansız=olanaksız) mümkün değildir. 1 olması olayın kesinlikle (yani %100) (mümkün=kesin) meydana geleceğini ifade eder.P(İ)=0 imkansız P(M)=1 mümkün olay içindir. Sıfıra yakın ihtimal zayıf bire yakın ihtimal kuvvetli 2. Bir olayın mümkün bütün hallerinin ihtimal toplamı 1 e eşittir. ∑P(Ei)= p(E1)+p(E2)+p(E3)+p(E4) ….=1 Bir olayın meydana gelme (p) ve gelmeme(q) ihtimalleri toplamı1 dir. p+q=1 bu tür ihtimallere birbirini tamamlayan ihtimaller denir. 1-p=q Paranın bir kez atlılması: P(Y)+P(T)=1 (belki dik gelebilir) iki kez atılması: P(YY)+P(YT)+P(TY)+P(TT)=1 Bir maç sonucu: P1(galibiyet)+P2(mağlubiyet)+P3(beraberlik)=1 Selami ÖZCAN İstatistik

136 İhtimale 3 yaklaşım (klasik, nispi, öznel)
Sonuçların ortaya çıkma ihtimalleri eşit ise klasik yaklaşım Bir deneydeki basit olayın ihtimali 1 in tüm sonuç sayısına bölünmesine eşittir. P(Ei)=1/toplam sonuç sayısı P(A)= A olayında içerilen sonuç sayısı / toplam sonuç sayısı Paranın bir kez atılmasında yazı ihtimali P(Y):1/2=0,5 tura ihtimali P(T):1/2:0,5 Zarın bir kez atılmasında çift sayı gelmesi ihtimali P(A)= 2,4,6/1,2,3,4,5,6=3/6=0,5 Bir derneğin 100 üyesi(60 erkek, 40 kadın) var. Dernek başkanının kadın olma ihtimali nedir? 40/100=0,4 Öznel yaklaşım: ne sonuçlar eşit, ne de veri üretmek için tekrarlanabilen deneylerle karşılaşılabilir. Bir olay için sübjektif değer yargısına, tecrübe, bilgi ve düşünceye dayalı ihtimaldir. Göreli (Nispi) sıklık yaklaşımı: ortaya çıkma ihtimalleri eşit değil, mesela; rastgele seçilen bir ailenin yıllık geliri TL den büyük olma ihtimali, civalı bir zarın atılması durumu, hileli paranın atılması durumu, 80 yaşındaki birinin bir sene sonra ölme ihtimali Yaklaşık ihtimal için göreli sıklık: bir deney n kez tekrarlanmış ve f kez bir A olayı gözlenmiş ise P(A)=f/n dir. Ör: rastgele 500 ürün seçilmiş bunlardan 10 tanesinin hatalı olma ihtimali nedir? 10/500=0,02 ilk üretilen ürünün hatalı olması, hatasız olma ihtimali ise:0,98 yaklaşık ihtimal söz konusu, gerçek ihtimal değil. Deney sonsuz(çok) kez tekrarlanırsa gerçek ihtimale yaklaşır.Buna Büyük sayılar Yasası denir. Ör: Ankara’dan rastgele seçilmiş bir ailenin ev sahibi olma ihtimali nedir? Ankara’da ikamet edenlerin ne kadarı ev sahibi bilinmiyor. Eşit değil Rastgele 1000 aile seçiliyor, 670 ev sahibi 330 değil P(A)=f/n 670/1000=0,670 Selami ÖZCAN İstatistik

137 Selami ÖZCAN İstatistik
Sayma Kuralı Sonuç sayısı az iken listelemekte sorun yok idi, fakat çok sayıda sonucu listelemek zor. Çok sayıda sonuç için sayma kuralı geçerlidir. Aynı anda vuku bulmaları imkansız olan birbirinden farklı k adet olay n defa tekrarlanırsa örnek: bir para 10 kez atılıyor sonuç: 2x2x2x2x2x2x2x2x2x2= =1024 İlk denemede k1, 2. denemede k2, n. Denmede kn dir. k1 x k2 x k3x..kn ör. 4 çeşit salata, 10 çeşit çorba, 3 çeşit meşrubat ve 6 çeşit tatlı var. Mümkün sonuç:4x10x3x6=720 Ör. bir deneyde ilk aşamada r tane, 2. aşamada n tane, 3. aşamada k tane sonuç olmak üzere 3 aşama bulunuyorsa bu deneyin toplam sonuç sayısı: r.n.k dır. Sonuç sayısının 3 ten az veya çok olması sayma kuralı için fark etmez. Bir para üç kez atılıyor. Her atılmada 2 durum(Y,T) vardır. 2x2x2=8 sonuç var. yyy, yyt, yty, ytt, tyy, tyt, tty, ttt Bir otomobil fabrikası 2 durum (sabit ve değişken faiz oranları) ile 36, 48 ve 60 ay vade yapmaktadır. Kaç farklı satış olur?2x3=6 sonuç Süper ligte 16 maç yapılmakta her maçın 3 durumu (galibiyet, mağlubiyet, beraberlik) söz konusu her takım için toplam sonuç sayısı nedir? 3x3x3x3x3x3x3x3x3x3x3x3x3x3x3x3= = kn 210 316 Selami ÖZCAN İstatistik

138 Bileşen (Marjinal) ve Şartlı (bileşik) İhtimaller
Cinsiyet Onaylıyor (A) Onaylamıyor (B) Toplam Erkek (E) 15 45 60 Kadın (K) 4 36 40 19 81 100 Herhangi bir başka olay dikkate alınmaksızın sadece bir olaya ilişkin ihtimale Bileşen (basit) ihtimal denir Bir olayın oluştuğunun bilinmesi durumunda diğer olayın meydana gelme ihtimaline şartlı (bileşik) ihtimal denir. Örnek: Çalışanların cevaplarına ilişkin iki yönlü sınıflama: 100 kişiye üst seviye yöneticilere çok yüksek ücret ödenmesi sorulmuş erkek (60) 15 onaylıyor 45 onaylamıyor; kadın (40) 4 onaylıyor, 36 onaylamıyor. P(E)=erkeklerin sayısı/tüm çalışanların sayısı=60/100=0,6 P(K)=kadınların sayısı/tüm çalışanların sayısı=40/100=0,4 P(A)=19/100=0,19 P(B)=81/100=0,81 Şartlı (Bileşik) ihtimalli iki yönlü sınıflama P(EA)=ihtimali hesaplanacak olay/gerçekleşmiş olay 15/60=0,25 (seçilen kişinin yüksek ücreti onaylayan ve erkek olma ihtimali 0,25 tir. Erkek onaylıyor 15/19 Onaylıyor Kadın onaylıyor 4/19 Verilen olay Erkek onaylamıyor 45/81 Onaylamıyor 36/81 Kadın onaylamıyor Selami ÖZCAN İstatistik

139 Selami ÖZCAN İstatistik
Ayrık Olay, Ayrık Olmayan Olay Birlikte ortaya çıkmayan olaylara denir. Birlikte olamayan olaylara karşılıklı ayrık olaylar denir. Bu tür olayların ortak sonuçları bulunmamaktadır. Şayet iki ve daha fazla olay ayrık ise deneyin her tekrarında bu olaylardan en çok bir tanesi ortaya çıkmaktadır. Bir olayın ortaya çıkması, diğer olay ya da olayların ortaya çıkmasını dışta tutma. İki ayrık olayların ihtimalleri veya varsa olayların ihtimali toplanır. Deneyin herhangi bir tekrarında ortaya çıkacak sadece bir sonuç olduğu için nihai sonuçlar her zaman ayrıktır. Örnek:Zarın bir kez atılmasında a=çift b=tek c=5 ten küçük olması ihtimali=1,2,3,4 sayı 4/6= 0, 66 a ve b olayları ayrık fakat a ve c ayrık olmayan P(a, b)= 3/6 +3/6 =1(ayrık) P (a, c)=2,4 yani 2/6 ayrık değil Ör: hilesiz bir zar atıldığında 1 veya 5 gelme ihtimali P (1 veya 5)=1/6 +1/6=2/6=1/3 Ör: 8 kırmızı,5 sarı, 4 beyaz, 2 yeşil çekilen topun sarı veya beyaz olma ihtimali? İlk çekilen geri konuyor. 5/19+4/19=9/19=0,47 b a c a 3 5 2 4 6 1. 3. 4. 5. Selami ÖZCAN İstatistik

140 Bağımlı/Bağımsız Olay
Bağımsız Olay: şayet bir olayın ortaya çıkması öteki olayın ortaya çıkma ihtimalini etkilemiyorsa bu iki olaya bağımsız olaylar denir. P(A/B)=P(A) veya P(B/A)=P(B) şartı yerine getirilmelidir. Bağımlı olaylar: bir olayın ortaya çıkması, diğer olayın ortaya çıkma ihtimalini etkiliyorsa bu olaya bağımsız olmayan veya bağımlı olay P(A/B) ≠ P(A) veya P(B/A) ≠ P(B) Örnek: 100 kaset (15 i bozuk), 60 ı 1.makinede (9 u bozuk), 40 ı 2.makinede (6 sı bozuk) üretilmiştir. Rastgele seçilen bir kasetin bozuk olma ihtimali nedir? D:rastgele seçilen kasetin bozuk olma iht. A:bu kasetin 1. makinede üretilmiş olma iht. P(D)=15/100=0,15 P(D/A)=9/60= 0,15 eşit çıktı bu iki olay (D ve A) bağımsız olaydır. Ayrık olaylar her zaman bağımlıdır. Bağımlı olaylar her zaman ayrık olmayabilir. Selami ÖZCAN İstatistik

141 Selami ÖZCAN İstatistik
A ͞A TAMAMLAYICI OLAY İki ayrık olayın bir deneyin tüm sonuçlarını içeriyorsa bu iki olay birbirinin tamamlayıcısıdır. Tamamlayıcı olaylar her zaman ayrık olaylardır. P(A) + P(͞A) =1 dir. Örnek: 5 makinenin 2si bozuk,rastgele seçilenin bozuk olma ihtimali nedir? A:seçilen makine bozuk, ͞A:seçilen makine sağlam P(A)=2/5:0,40 P(͞A):3/5:0,60 Örnek: zarın bir kez atılması olayında 4’ten büyük çıkma (5,6) ihtimali nedir? P(A)=2/6=0,33P(͞A)=4/6=0,67 veya 1-0,33=0,67 Selami ÖZCAN İstatistik

142 OLAYLARIN ARA KESİTİ ve ÇARPMA KURALI
B OLAYLARIN ARA KESİTİ ve ÇARPMA KURALI Çarpma kuralı: bileşik ihtimal AnB veya AB P(A ve B)=P(A) x P(B) İki olay 1.olayın bileşen ihtimali 2.olayın şartlı ihtimali Tamam Red Toplam Erkek 7 20 27 Kadın 4 9 13 11 29 40 P(E) ve P(T) P(EveT)=P(E) x P(T/E) (27/40)x(7/27)=7/40=0,175 Erkek ve tamam Ör: 20 kaset 4 ü bozuk, 2 tane seçiliyor seçilen 2 kasetinde bozuk olma ihtimali (iadesiz çekiliş) S1: ilk seçilen kasetin sağlam olma iht.16/20 B1: ilk seçilen kasetin bozuk olma iht. 4/20 S2: ikinci seçilen kasetin sağlam olma iht.15/19 B2: ikinci seçilen kasetin bozuk olma iht.3/19 P(B1 ve B2)=P(B1) x P(B2/B1)=4/20 x 3/19=0,032 Selami ÖZCAN İstatistik

143 BAĞIMSIZ OLAYLAR ÇARPMA KURALI
A ve B gibi bağımsız 2 olayın bileşik ihtimali P(A ve B)= P(A) x P(B) Örnek. 2 adet yangın tüpü var herhangi birinin çalışmama ihtimali 0,02 yangın anında her ikisinin de çalışmama ihtimali nedir? P(1 ve 2)= P(1) x P(2) = 0,02x0,02=0,004 Ayrık olayların bileşik ihtimali İki ayrık olayın bileşik ihtimali her zaman 0 dır.P(A ve B)=0 Örnek: iş başvurusu kabul ve red, kabul ve reddin bileşik ihtimali 0 dır. Selami ÖZCAN İstatistik

144 OLAYLARIN BİLEŞİMİ VE TOPLAMA KURALI
AuB P(A veya B)=P(A)+P(B)-P(AveB) OLAYLARIN BİLEŞİMİ VE TOPLAMA KURALI Örnek: Erkek 45 kabul, 15 red, 10 çekimser; Kadın 80 kabul 110 red, 30 çekimserdir. Erkek ve red olma ihtimali: 70/300:0, /300:0,416 P(E/R)= 0,233x0,214=0,04499 P(E ve R):P(E)+P(R)-P(E/R) 0, ,416 – 0,04499=0,6 Ayrık olaylarda toplama kuralı P(A veya B)=P(A) + P(B) Toplama kuralı (yandaki örneğe göre) P (red veya çekimser) olma ihtimali nedir? 125/300+40/300=0,416+0,133 =0,563 Selami ÖZCAN İstatistik

145 5. BÖLÜM: Kesikli Rassal Değişkenler Kesikli İhtimal Dağılımları
Rassal Değişken: bir deney/gözlemin şansa bağlı sonucunda bir değişkenin aldığı değere (ihtimal ve istatistikte) rassal değişken adı verilir. Kesikli Rassal Değişken: yalnız belirli tamsayı değerleri alabilen, birbirini izleyen değerler arasında belirli boşluklar (sayımla elde edilen değerler) varsa kesikli rassal değişken sayılabilir. Ör.Satılan otomobil sayısı, bilet sayısı, izleyici sayısı, elbise sayısı, çocuk sayısı vb. Sürekli Rassal Değişken: ölçüm/tartımla elde edilen değerler, iki değer arasına sonsuz sayıda değer sıkıştırılabilen değişken sürekli rassal değişkendir. Ör. Boy uzunluğu, bir sorunun çözülme süresi, ağırlık, bir evin değeri(fiyatı) vb. Kesikli rassal değişkenin ihtimal dağılımına örnek Oto sayısı:0,1,2,3,4 Frekans(sıklık):30,470,850,490,160=2000 Nisbi frekans: 0,015;0,235;0,425;0,245;0,080=1 Kümülatif nisbi frekans:0,015;0,25;0,675;0,92;1 İhtimal dağılımı P(X):0,015;0,235;0,425;0,245;0,080=1 P(x) değerleri , X değerlerinin ihtimal dağılımını oluşturur P(2)=0,425 tir. 0≤P(X)≤1 ve ∑P(X)=1 0,5 0, 425 0,4 0,3 0,245 0,235 0,2 0,1 0,080 0,015 0,0 X Selami ÖZCAN İstatistik

146 Kesikli bir Değişkenin Ortalaması ve Standart Sapması
Kesikli Değişkenin Ortalaması Beklenen Değer (Matematik Ümit) E(x)=µ=∑x P(X)= n x P(X) X kesikli değişken, n adet denemede X1 olayı P1 ihtimalle, Xn olayı Pn ihtimalle meydana geliyorsa X1 in beklenen değeri E(x=1)=n.P1 Ör:3 er birimlik 1000 paket mal satın alınmakta kusur sayılarına ilişkin ihtimal tablosu aşağıda beklenen değeri bulunuz E(x=0)=n.P0=0x0,512=0 E(x=1)=n.P1=1x0,384=0,384 E(x=2)=n.P2=2x0,096=0,192 E(x=3)=n.P3=3x0,008=0,024 µ=∑x P(X)=0,6 Kesikli Değişkenin Standart Sapması Ó=Standart sapma ss’nın büyük olması x değerlerinin ortalama etrafında geniş bir aralıkta değerler aldığını, SS küçük olması dar aralıkta dağıldığını gösterir. Gözlenen değerlerin ortalamaya yakın dağıldığını gösterir İstatistiksel değerlendirmelerde standart sapmanın karesi alınarak bulunan ve sigma kare ile varyans değeri hesaplanır Ör: x arızalı parça, 400 parça sevkiyatın ihtimal dağılımı tabloda var. Ortalama ve standart sapmayı bulunuz? Yorum: 400 parça sevkiyatın 1,2 standart sapma değeri ile 2,5 tanesi arızalıdır. X 1 2 3 4 5 Top. P(X) 0,02 0,20 0,30 0,10 0,08 X P(X)=µ 0,00 0,60 0,90 0,40 2,50 X 2 9 16 25 55 X 2 P(X)=sigma 1,20 2,70 1,60 2,00 7,70 X 1 2 3 Top P(X) 0,512 0,384 0,096 0,008 Selami ÖZCAN İstatistik

147 Kesikli Dağılımın Beklenen Ümit ve Varyansı
Örnek:Bir zar atılıyor. Anlaşmaya göre Ali babasından her atışta kaç gelirse o kadar TL para alacaktır. Atış başına Ali nin beklediği parayı bulunuz. X= x f(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 1 Örnek: Bir kitaptaki bir sayfadaki yanlış sayısı ile ilgili X’in olasılık fonksiyonu şöyledir: P(x=0)=0.81 hiç yanlış olmaması P(x=1)=0.17 bir yanlış olması P(x=2)=0.02 iki yanlış olması Sayfa başına ortalama yanlış sayısını bulunuz. Sayfa başı ortalama 0.21 yanlış bulunur. Ali’nin atış başına ortalama kazancı Selami ÖZCAN İstatistik

148 Faktöriyeller ve Kombinasyonlar
Faktöriyeller ! 1’e kadar tüm pozitif sayıların çarpımından oluşur. Kural 1!=1, 0!=1 Sıra önemli olduğunda n adet olay n!=n(n-1) ör.6 kitap 6!=6x5x4x3x2x1=720 Sıra önemli olduğunda n adet olaydan x adeti n!/(n-x)! (permutasyon) 6 kitap 4lü şekilde kaç farklı şekilde dizilir. 6!/(6-4)! =360 Kombinasyonlar (C) Sıra önemli olmadığında n adet olaydan x adedinin seçilme yollarının sayısını vermektedir. n=toplam eleman sayısını x= her seferinde seçilecek eleman sayısı Not:n değeri x ten büyük en fazla eşit olmalı Örnek. 6!/4! (6-4)! =15 Ör. 20 öğretim üyesinden 5 tanesi rastgele proje için seçilecek, kaç farklı seçim olur 20!/5! (20-5)! =15.504 Selami ÖZCAN İstatistik

149 ÖNEMLİ BAZI KESİKLİ DAĞILIMLAR
Üniform Dağılımı Bernoulli Dağılımı Binom Dağılımı-Poisson a Yaklaşımı Poisson Dağılımı-Binom a yaklaşımı Geometrik Dağılım Hipergeometrik Dağılım Pascal (Negatif Binom) Dağılımı Selami ÖZCAN İstatistik

150 1. Üniform Dağılımı Kesikli bir şans değişkeni tanımlı olduğu tüm noktalarda eşit olasılık değerine sahip ise bir başka ifadeyle tanımlı olduğu değerlerin hepsinde olasılık fonksiyonun aldığı değer sabit ise bu kesikli şans değişkeni üniform dağılımına uygundur. Üniform dağılımı gösteren bir şans değişkeni k farklı noktada tanımlı ise olasılık dağılımı; şeklinde ifade edilir.

151 Üniform Dağılımının Beklenen Değer ve Varyansı
=

152 Örnek: Hilesiz bir zar atıldığında X şans değişkeni ortaya çıkabilecek farklı durum sayısını ifade ettiğine göre X’in olasılık dağılımını oluşturarak beklenen değerini ve varyansını bulunuz. Çözüm S = { x / 1,2,3,4,5,6 } Ortaya çıkan olaylar eşit olasılıklı olaylar x şans değişkeninin dağılımı k = 6 olan kesikli üniform dağılımına uygundur.

153 Selami ÖZCAN İstatistik
2. BERNOULLİ DAĞILIMI Bir şans değişkeninin bernoulli dağılımı göstermesi için ilgilenilen süreçte bernoulli deneyinin varsayımlarının sağlanması gereklidir. Bernoulli Deneyinin Varsayımları: - Deneyler aynı koşullarda tekrarlanabilirlik özelliğine sahip olmalıdır. - Deneylerin yalnız iki mümkün sonucu olması gereklidir. - Başarı olasılığı (p),deneyden deneye değişmemektedir (Başarısızlık olasılığı q = 1-p ile gösterilir) - Denemeler birbirinden bağımsız olmalıdır. İki sonucu olan durum Başarılı başarısız Başarı 1 ve başarısızlık 0 Başarılı ihtimali p(x) Başarısızlık ihtimali q(x) veya 1-p p(X=x)= p(x=1) ve 1-p (x=0) P(X=x)= p² x (1-p)ª-³, x=0,1 beklenen değer: µ=E(x)=P dir Standart sapma (σ)=√p.(1-p) Ortalaması µ=∑x . P(x) Selami ÖZCAN İstatistik

154 Selami ÖZCAN İstatistik
ÖRNEKLER 1: Hilesiz bir para atılıyor. X=tura A=(T) S=(T,Y) T gelmesi başarı yani 1 dir. nA=1 ve n=2 p=P(X=1)=P(A)=nA/n = ½ 1-p=P(x=0)=1-p(x=1)=1/2 Benoulli dağılımı ½ dir. 0,5 tir. X rassal değişkenin ihtimal dağılımı P(X=x)= ½ x=0 ve ½ x=1 P(X=x)=(½)x (½)1-x x=0,1 olarak elde edilir. 2:Hilesiz iki zar atılıyor.Başarı ikisininde 6,6 gelmesi x=1 Başarısızlık ikisininde 6,6 gelmemesi x=0 A=(6,6) ve nA=1 p=P(x=1)= P(A)= nA/n=1/6 iki tane olunca 1/6x1/6=1/36 1-p=P(x=0)= 1-P(x=1)= 35/36 dır. P(X=x) (1/36)x . (35/36)1-x x=0,1 3: 100 kalemden 97 kusursuz. Rastgele seçilen bir kalemin kusursuz olma başarı (x=1) ihtimali Kusurlu olma başarısız (x=0) ihtimali nA=97 n=100 97/100=0,97 kusursuz iht. 1-0,97=0,03 kusurlu olma ihtimali P(X=x)=(0,97)x . (0,03)1-x x=0,1 Selami ÖZCAN İstatistik

155 Örnek: Bir deste iskambilden çekilen bir kağıdın as olup olmaması ile ilgileniyor. As gelmesi başarı olarak ifade edildiği durum için olasılık fonksiyonunu oluşturunuz. x = 0 (as gelmemesi) x = 1 ( as gelmesi) S = { x / 0,1 } P( X = 0 ) = 48 / P( X = 1 ) = 4 / 52

156 3. BİNOM (İKİ DURUM) İHTİMAL DAĞILIMI
n:tekrarlı bir deneyde (toplam deneme sayısı), x kez istenen (başarı) sonuç gelmesi durumunda ihtimallerin bulunması için P(X) başarılı sonuç elde etme ihtimali X değişkeninin iki sonuçlu (kesikli) bir değişken olması gerek. Deneyin her tekrarından sonra bu iki sonuçtan birinin ortaya çıkması gerekir. Kız,erkek; yazı tura; başarılı, başarısız; hatalı hatasız; iki sonuçlu olaylar binom dağılımı ile çözülür. p=1-q X değerleri 0,1,2,3 … gibi kesikli değerler ve bu değerler için nokta ihtimalleri hesaplandığından binom dağılımı kesikli ihtimal dağılımıdır. P=0,5 binom dağılımı simetriktir. P<0,5 sağa; 0,5<p ise sola çarpık Ortalama=n.p varyans=np(1-p) standart sapma=√np(1-p)=√npq Moment çarpıklıkά3=(1-p) / √npq, moment basıklıkά4=3+(1-6p)q / npq Binom Dağılımının Özellikleri Deney n kez aynı şartlarda tekrarlanmalı Sadece iki sonucu olmalı İki sonucun ihtimali her deneme için aynı ve bire eşittir. Denemeler bağımsız, bir denemenin sonucu diğer denemenin sonucunu etkilememektedir. Selami ÖZCAN İstatistik

157 Binom Dağılımına Örnek
0!=1 Bir sayının 0. kuvveti 1 dir. Binom Dağılımına Örnek %15 kusurlu şansa bağlı alınan 3 örneğin en az iki mamulün kusurlu olma ihtimali nedir? Çözüm: P(x≥2)= P(x=2) + p(x=3) (3/2)0,15x0,15x0,85+(3/3)0,15x0,15x0,15x0,85.sıfırıncı kuvveti =0,0574+0,0034=0,0608 %6,08 Örnek: %10 hatalı, 4 birimlik mamulun en çok 2 sinin hatalı olma ihtimali nedir? Çözüm: n=4 P(x≤2)=P(x=0)+P(x=1)+p(x=2) =0,6561+0,2916+0,0486=0,9963=%99,63 Ör. Bir fabrikada üretilen tv lerin arızalı olma ihtimali %5 tir. 3 tv seçtiğimizde 1.nin arızalı olma ihtimali (binom) nedir? Çözüm: 0,1354=%13,54 yanda çözümü Örnek:Kargo şirketi paketlerinden %2 si zamanında ulaşmıyor. Bir müşteri 10 paket veriyor. 1 tanesinin zamanında ulaşmama ihtimali? (10/1) 10x(0,02)1x(0,98)9=0,1667 En çok 1 tanesinin zamanında ulaşmama ihtimali?p(x=0)+p(x=1)=0,9838 Binom Dağılımının Ortalama(np) ve Standart Sapması(√npq) Ör:Bir şehirde yaşayanların oyların %58 i A partisi almış, bu şehirden 25 kişi seçildiğinde X’in(A partisine oy verenlerin) ihtimal dağılımının ortalaması ve standart sapması nedir? Ortalama:25x0,58=14,5 Standart sapma:√25x0,58x0,42:2,47 Yorum: seçilen 25 kişiden 2,47 standart sapmayla ortalama 14,5 kişinin A partisine oy vermesi beklenmektedir. Selami ÖZCAN İstatistik

158 BİNOM DAĞILIMINA ÖRNEK
Bir fabrikada üretim yapan makinalardan birinin ürettiği ürünlerin 0,09’u kusurlu olarak üretilmiş bulunmaktadır. Bu ürünlerden 4 adedi rastgele seçilmiştir. Hiç özürlü ürün seçilmemiş olma olasılığı nedir? P(k;n;p) = n! k!(n-k)! p k.q n-k 4! P(0;4;0,09) = 0, , = 0,6857 0!(4-0)!

159 Selami ÖZCAN İstatistik
3. POİSSON DAĞILIMI Poisson, binom gibi kesikli bir ihtimal dağılımıdır. Verilen bir aralıkta (zaman, hacim aralığı vb) tekrar sayısının ortalaması biliniyorsa poisson kullanılır. X ile gösterilen tekrar sayısına ilişkin herhangi bir değerin ihtimali hesaplanabilir. Üzerinde durulan olayın meydana gelme ihtimali çok küçüktür. n in büyümesi P nin küçülmesi halinde binom yerine poisson formülü kullanılır. Yani np değeri 5 ten küçük olduğunda ʎ: poisson dağılımının ortalaması, bu dağılımın varyansı da ʎ eşittir. Matematik sabiti e ise yaklaşık olarak 2,71828 dir. µ ortalama= ʎ= σ ² varyans, standart sapma σ =√ ʎ Moment çarpıklık ölçüsğ ά3=1/ ʎ moment basıklık ölçüsü:3+1/ ʎ Not: poisson dağılımı normalden daha dik ve sağa çarpıktır. ʎ büyüdükçe dağılım simetrikleşir. Örnek: bir hastanenin acil servisine bir günde gelen hasta sayısı; bir makinede üretilecek 100 parçadan hatalı parça sayısı; bir mağazadan 1 haftada satılan buzdolabı sayısı (randevulu gelen hasta rassal olmadığı için poisson uygulanamaz) Örnek: bir çamaşır makinesi ayda ortalama 3 kez arızalanmakta, poissona göre gelecek ay iki kez arızalanması ihtimali ve en çok bir kez arızalanması ihtimali nedir? Çözüm: a) P(x=2)= b)P(x≤1)=p(X=0)+p(X=1) Selami ÖZCAN İstatistik

160 Poisson Dağılımının İhtimal Fonksiyonu
l : belirlenen periyotta ortaya çıkan olay sayısı x : ortaya çıkma olasılığı araştırılan olay sayısı S = { x / 0,1, 2, 3, ….., }

161 Poisson Dağılımının Beklenen Değer ve Varyansı
Beklenen değeri ve varyansı birbirine eşit olan tek dağılıştır.

162 Örnek: Bir mağazaya Cumartesi günleri 5 dakikada ortalama olarak 4 müşteri gelmektedir. Bir Cumartesi günü bu mağazaya, 5 dakika içinde 1 müşteri gelmesi olasılığını, Yarım saate 2’den fazla müşteri gelmesi olasılığını, a) l = 4 P ( x = 1 ) = ? 5 dk’da 4 müşteri gelirse, 30 dk’da 24 müşteri gelir. l = 24 P ( x > 2 ) = ? P( x > 2 ) = 1 – [P(x=0)+P(x=1)+P(x=2)] ÖDEV: 1 saatte en çok 1 müşteri gelmesinin ihtimalini hesaplayınız.

163 Poisson Dağılımına Örnek
Örnek1: A bankasında günde 2 hesap açılıyor, herhangi bir günde 6 yeni hesap açılması ihtimali, en çok 3 yeni hesap açılması ihtimali, en az 7 hesap açılması ihtimali nedir? a) p(x=6)= ortalama(ʎ)=2, x=6 formülde yerine koyarsak: 0,0120 b) P(X≤3)=P(X=0)+P(x=1)+p(x=2)+p(x=3)=0,8571 c)p(x≥7)=1-p(x<7):1-[p(x=0)+p(x=1)+p(x=2)+p(x=3)+p(x=4)+p(x=5)+p(x=7)]=0,0045 Örnek2: ortalaması x=2,6 poisson dağılışı gösteren bir değişkenin standart sapması nedir? Çözüm: ortalama (µ)=landa (ʎ)=varyans (ó)=2,6 dır. Standart sapması√2,6=1,61 dir. Ör:Bir otomobil satış yerine ayda ortalama 150 müşteri gelmektedir.Herhangi bir günde satış yerini açmayan galeri sahibi %kaç ihtimalle en az 3 müşteriyi kaçırmıştır.(ay=30) Günlük ortalama:150/30=5 tir. 3 veya daha fazla müşteriyi kaçırma ihtimali (iki durum ya 3 ten sonsuza kadar olan ihtimaller hesaplanacak veya 3 ten küçük olanlar (x=0,1,2) hesaplanıp 1 den çıkarılacaktır. P(x≥3)=1-p(x=0)+p(x=1)+p(x=2)=0,8754 %87,54 Örnek: bir havaalanından her 100 uçaktan biri mecburi iniş yapmaktadır. Herhangi bir ayda 4000 uçaktan en çok 2 sinin mecburi iniş yapması ihtimali nedir?0,2381 Selami ÖZCAN İstatistik

164 POİSSON DAĞILIMINA ÖRNEK
Bir fabrikada üretilen ürünler 0,001 olaslıkla bozuktur. Rastgele örnekleme ile 2000 adet alınmıştır. 4 adet ürünün bozuk olma olasılığı nedir?  = ,001 = 2  = n. p = E(x)= V(X) = 4 - 2 2 P(x=k) = e -  k k! P(x=4) = e = 0,09 4!

165 BİNOM’UN POİSSONA YAKLAŞIMI
POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p < 0,05 VE n >20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR. Selami ÖZCAN İstatistik

166 POİSSON’UN BİNOMA YAKLAŞIMI
POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p < 0,05 VE n >20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR. BİNOM POİSSON X 1 2 3 n= 5, p= 0, n= 20 , p=0, =np=1 0,328 0,410 0,205 0,051 0,359 0,377 0,189 0,060 0,368 0,184 0,061

167 5. HİPERGEOMETRİK DAĞILIM
Binom ve hipergeometrik dağılım aynı tür olaylara uygulanır. Örnekleminin şekli önemli, binomda sınırsız anakütleden iadesiz çekilişler veya sınırlı anaküteleden iadeli çekilişler (çekilişler birbirinden bağımsız), bu yüzden binomdaki p değeri çekilişten çekilişe değişiklik göstermez. Hipergeometrikte ise; sınırlı anakütleden iadesiz çekiliş veya bir sonraki çekiliş bir önekine bağımlıdır. Örnek:2 istatistik, 3 bilgisayar, 4 yöneylem hocasından 3 kişilik sayısal yöntemler jürisi oluşturulacaktır. Jüride en az bir istatistik hocasının bulunması ihtimali nedir? Çözüm: P(x≥1)=p(x=1)+P(x=2) P(x≥1)=(2/1).[(9-2)/(3-1)]/9/3 + (2/2).[(9-2)/(3-2)]/9/3 P(x≥1)=42/84+7/84=49/84=05833 Örnek:not ortalaması 85 in üzerinde olan 4 iktisat, 7 işletme öğrencisinden 3 kişilik grup oluşturulacak, grupta bir iktisatçı bulunması ihtimali?N=11 n=3 A=4 Formulde x yerlerine 0 ve 1 konacak P(x≤1)=p(x=0)+p(x=1)=0,7212 Selami ÖZCAN İstatistik

168 HİPERGEOMETRİK DAĞILIMA ÖRNEK
İçinde 10 sağlam ve 4 arızalı mal bulunan bir topluluktan 5 mal alınmıştır. Bunlardan üçünün sağlam çıkma olasılığı nedir? P(X=x) = Acx . N-Acn-x Ncn N=14 A=10 n= 5 x= 3 P(X=3) = 10c c5-3 14c5 = 0,3596

169 6. PASCAL(NEGATİF BİNOM) DAĞILIMI- ÖRNEK
Bir imalat hattında kusurlu parça oranı 0,6 olarak bilinmektedir. 5. Parça üretildiğinde 3. Kusurlu parçanın ortaya çıkma olasılığı nedir? P(x)= X-1Ck-1 . p q k x-k X=5 K=3 P(5)= 5-1C , ,4 3 5-3 = 0,2074

170 Selami ÖZCAN İstatistik
Sorular İstatistik birimlerinin sahip oldukları özelliklere ne ad verilir? Veri Şık Parametre Sabit değişken 1,1,2,3,5,8,11,13 basit serisinin medyanı kaçtır? 4 4,5 5 5,5 6 Bir zar 3 kez atıldığında kaç olası sonucu vardır. 112 143 165 210 216 Sınıflar:10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80 Frekans:1,5,7,12,20,24,25 den çok:25,24,20,18,13,5,1 50 den büyük gözlem sayısı kaçtır. 8 12 13 18 20 Anakütleden uygun tekniklerle çekilen birimlerin oluşturduğu alt topluluğa ne ad verilir? Sınıf Örneklem Evren Grup istatistik X=1,3,5,6,8,9 kareli ortalaması nedir? 4,31 5 5,33 5,5 6 Selami ÖZCAN İstatistik

171 Selami ÖZCAN İstatistik
X=12,23,34,45,56 Değişim aralığı nedir? 12 17 34 44 56 X=3,4,6,8,9 standart sapması nedir? 12,28 5,2 5,53 5 6 Bir örneklemin gözlem değeri için hesaplanan karakteristik değere ne ad verilir? Ortalama Frekans İstaitik Anlam frekansı parametre 1 den 10 kadar sayılar arasından seçilen bir sayının 2 ve 3 e bölünebilen bir sayı olma ihtimali kaçtır? 1/10 1/5 3/10 1/2 1/8 Xi ortalama (µ) standart sapma (sigma)=10 normal dağılım göstermektedir. X=55 değerinin standart normal değeri (z) kaçtır? 0,5 1 1,5 2 5 Kusursuz bir madeni para 2 kez atılmış, 1. atış yazı iken 2.ninde yazı gelme ihtimali kaçtır? 1/3 2/3 3/4 Selami ÖZCAN İstatistik

172 Selami ÖZCAN İstatistik
Histogramın temel noktalarının birleştirilmesi ile elde edilen grafik türünün adı nedir? Pasta grafiği Frekans poligonu Sütun grafiği Alan kodu Serpilme diyagramı 10 gözlem değerinden oluşan basit bir serinin aritmetik ortalaması 50 ise bu serideki gözlem değerleri toplam kaçtır? 0,5 5 40 60 500 Sınıflar: 10-15, 15-20, 20-25, 30-35 Frekans: 40, 27, 18, 10, 5 /100 serinin frekans eğrisi aşağıdakilerden hangisidir? Sola eğik J biçiminde Sağa eğik Ters J U biçiminde Ortalamalarla ilgili ifadelerden hangisi yanlıştır? v Birimle ilgili ifadelerden hangisi yanlıştır? q Aşağıdakilerden hangisi tam sayımı engelleyen nedenlerden biri değildir? Maliyetli olması Ölçülen birimde tahrip yapması Anakütle hacminin küçük olması Zaman sınırlaması Anakütle hacminin sonsuz sayıda olması X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 ortalaması kaça eşittir? 1 1,6 2,7 3 3,8 X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 standart sapması kaça eşit? 7 9 10 Selami ÖZCAN İstatistik

173 Selami ÖZCAN İstatistik
Serilere ilişkin ifadelerin hangisi doğrudur? c Aşağıdaki serinin modu nedir? X=3,5,8,13,21,34 Frekans=1,7,2,9,6,4 7 9 11,5 13 14,93 50 birimlik örneklem 3. tabakadan seçilen birim sayısı nedir? 4 15 20 35 40 Standart normal dağılmış (z) bir değişken P(0,52)<z<2,14 ihtimali nedir? 0,1772 0,1985 0,2054 0,2854 0,4838 Başarı ihtimali p=0,2 q=0,8 (başarısızlık) binomyal dağılmış değişkenin varyansı=4/5, deney sayısı n kaçtır? 2 4 5 8 10 X=72 standart sapması=15 bu imtihandan 90 alan bir öğrencinin Z (standart normal puanı) nedir? 1,2 0,7 0,3 -1,0 -1,2 Selami ÖZCAN İstatistik

174 6.BÖLÜM: Sürekli İhtimal Dağılımları
En çok bilinen sürekli ihtimal dağılımları Üstel Dağılım Gama Dağılımı Weibull Dağılımı Normal Dağılım Selami ÖZCAN İstatistik

175 1. ÜSTEL DAĞILIM Elektronik cihazların ömür ve güvenirlik (reliability) hesaplamalarında çok kullanılan bu dağılımın olasılık yoğunluk fonksiyonunun grafiğinin şekli aşağıdadır. Bu dağılımı tanımlayan en önemli özellik arıza oranıdır(). 0,2 0,16 0,12 0,08 0,04 = 5 = 10 = 15 f(x) X

176 ÜSTEL DAĞILIM  = -t R(t) = e -a F(a) = P(x<a) = 1- e  =  
ÜSTEL DAĞILIM OLASILIK FONKSİYONU: f(x) =  e - x X > 0  : SİSTEMDEKİ ARIZA ORANI ( >0) ÜSTEL DAĞILIM ORTALAMASI:  = 1  : SİSTEMDEKİ ARIZA ZAMANI ORTALAMASI ÜSTEL DAĞILIM VARYANSI: ZAMANA BAĞLI ALET GÜVENİRLİĞİ:  = 2 1 R(t) = e -t BİRİKİMLİ ÜSTEL DAĞILIM FONKSİYONU: F(a) = P(x<a) = 1- e -a a > 0

177 ÜSTEL DAĞILIM-ÖRNEK a. E(X) = = = 4 saat  = R(t) = e -t
Seri üretim yapan bir fabrikadaki kusurlu mamullerin saat başına  =1/4 parametreli bir poisson sürecine uygun olduğu belirlenmiştir. İç denetçinin saha çalışması için üretim sisteminin başına saat 10:00’ da geldiği varsayıldığında; A. İlk kusurlu ürünün ortaya çıkmasının beklenen zamanını, B.İlk kusurlu ürünün en erken sat 11:00’de üretilmesi olasılığını, C.İlk kusurlu ürünün en geç saat 14:00’de üretilmesi olasılığını bulunuz. 1 1 a. E(X) = = = 4 saat  = 1/4 R(t) = e -t - 0.25t - 0.25(1) b. P(X1) = = e = e = -t -0.25(4) -1 c. P(X=4) = 1-e =1-e = 1-e = =

178 2. GAMA DAĞILIMI 0,2 0,16 0,12 0,08 0,04 = 1; r=1 = 1; r=2 = 1; r=3
= 1; r=1 = 1; r=2 = 1; r=3 f(x) X

179 GAMA DAĞILIMI r(r) r(r) -x  r-1 (x) e f(x) =  = ( a) - a
GAMA DAĞILIMI OLASILIK FONKSİYONU: -x (x) e r-1 f(x) = r(r) X > 0 ; r >O ;  >O GAMA DAĞILIMI ORTALAMASI: r  = GAMA DAĞILIMI VARYANSI: 2 r  = ( a) 2 - a k r-1 BİRİKİMLİ GAMA DAĞILIMI FONKSİYONU: F(a) =1-  e k! F(a) = 1-  00 (t)r-1 e - t dt r(r) k=0

180 3. WEIBULL DAĞILIMI Olasılık Kuramı ve İstatistik bilim dallarında Weibull dağılımı (Waloodi Weibull anısına isimlendirilmiş) bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu ise :                                       Burada  x ≥ 0     ve x < 0 için f(x; k, λ) = 0. k > 0 şekil parametresi ve λ > 0 Ölçek parametresi olurlar. Weibull dağılımı için Yığmalı(Cumulative) olasılık Fonksiyonu bir gerlmiş üstel (stretched) fonksiyondur. Yaşama, hayatta kalım ve yetmezlikle yıkım süreçlerini inceleyen verilerin analizi alanında Weibull dağılımı çok elastik olup kolayca değiştirilebildiği için çok kullanılmaktadır. Değişik parametre değerleri kullanılarak normal dağılım, üstel dağılım gibi çok popüler diğer istatistiksel dağılımların davranışların Weibull dağılımı kullanarak aynen taklid etme imkânı bulunmaktadır. Eğer k = 3.4 ise, Weibull dağılımı Normal Dağılım’ına benzerlik gösterir. Eğer k = 1 ise o zaman Weibull dağılımı Üstel Dağılımı’na dönüşür. Weibull dağılımı pratikte çok kere normal dağılım yerine kullanılmaktadır. Buna neden Weibull değisebiliri değerlerinin kolay matematik işlemlerle ortaya çıkan ters alma usulu ile üretilebilmekte ve buna karşılık normal değişebilir değerleri rettmek icin tipik olarak daha karmaşık işlemler gerektiren (her normal değer için iki tane tekdüze dağılım değişebilir değeri isteyen) Box-Muller yontemi ile elde etmek gerekmektedir. Endüstriyel mühendislik dalında fabrikasyon ve mal teslim zamanlarını temsil etmek için modellemelerde Weibull dağılımı kullanılmaktadır. Ayni bilim ve teknoloji dalında [[ mühendisliği ve failure analizi için istatistiksel modellere baz olamaktadir. Weibull dağılımı Lucasl deger teorisi ve meteorojide hava tahmin modellemesinde önemli rol oynamaktadir. Radar sistemlerinin modelleme alanında Weibull dağılımı çok popüler olarak rüzgar hızı dağılımını tanımlamak icin kullanılır çünkü doğasal pratik rüzgar hızı çizelgelerine teorik Weibull şekli çok uygun olmaktadır.

181 4. NORMAL DAĞILIM ±∞ sayıda değer alır.
İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir. Standart sapması, frekans eğrisi çan şeklinde olan simetrik dağılımdır. Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, medyan ve modları eşittir. Normal dağılımı meydana getiren birimler ölçme veya tartma yoluyla elde edilen verilerdir. ±∞ sayıda değer alır. Moment çarpıklık katsayısı: ά4=3 Normal dağılım fonksiyonu f(x) = 1/σx√2 e½(x-µx/σx)² e:2,71828 :3,14159 µ: anakütle ortalaması σ:anakütle standart sapması, x:herhangi bir sürekli değişkendir. Selami ÖZCAN İstatistik

182 Dağılım özelliğinin önemi nedir
Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir İsa Eşme

183 NORMAL DAĞILIMIN KRİTERLERİ
Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. Normal eğri altında kalan alan 1 e eşittir. Normal dağılımda nokta tahmini yapılamaz bu sebeple aralık tahmini (x1 ve x2 arası) yapılır. İsa Eşme

184 STANDART NORMAL EĞRİ ALANLARI X-µX σX
X değerlerinin standart z değerlerine dönüştürülmesi gerekir. Z tablosundaki Z değerleri 0 ile 3,99 arasındadır. Z=2,14 ün normal eğri alanı nedir? Z tablosundaki normal eğri alanlarını bulmak için; İlk sütundaki 2,1 ve ilk satırdaki 0,04 2,14 ün normal eğri alanı 0,4838 dir. İsa Eşme

185 Örnek1: Z1=-1,44 ile Z2=2,06 arasındaki alan kaçtır?
P(-1,44≤z≤2,06)=0,4251+0,4803=0,9054 Örnek 2: Z1=-1,44 ile Z2=-0,51 arasındaki alan kaçtır? P(-1,44≤z≤-0,51)=0,4251-0,1950=0,2301 Örnek 3: P(z ≤-1,44) değerini bulunuz? P(z ≤-1,44)=0,5-0,4251=0,0749 Örnek 4: P(z ≥-1,44) değerini bulunuz? 0,4251+0,5=0,9251 Selami ÖZCAN İstatistik

186 Selami ÖZCAN İstatistik
Örnek 5: ortalaması 5 kg, standart sapması 0,15 kg olan bir prosesten tesadüfi bir malın ağırlığı 5,05 kg dan fazla olma ihtimali nedir? X=5,05 standart z değerine dönüştürelim X-µX σX Z=(5,05-5,00)/0,15=0,33 tür. P(x≥5,05) P(z ≥0,33)=0,5-0,1293=0,3707 olur. Selami ÖZCAN İstatistik

187 Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :
1.      Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak. 2.      Varolan verilere parametrik olmayan bir test uygulamak KESİKLİ DAĞILIMLAR NORMALE YAKLAŞTIRILIR. (BİNOM, POİSSON VE HİPERGEOMETRİK DAĞILIM) İsa Eşme

188 BİNOM DAĞILIMININ NORMAL’E YAKLAŞIMI
n yeteri kadar büyük olması durumunda binom kesikli değişkeni yaklaşık olarak ortalaması np, varyansı npq olan bir normal dağılıma yaklaşır. Ayrıca p ihtimal değerinin 0.5’e yaklaştığı bütün durumlarda binom dağılımı yerine normal dağılım kullanılabilir. Binom dağılımı kesikli standart z normal dağılımı süreklidir. Dönüştürmek için; n 30 , np 5 ve p= Bu durumda; E(X)=  = np ve Varyans  = npq X -  (X+0,5) - np X -  X - np z = = z = = npq npq

189 Örnek 1: Büyük bir şirkettte çalışan personelin % 40’ bayandır
Örnek 1: Büyük bir şirkettte çalışan personelin % 40’ bayandır. Çalışanlar arasından rastgele olarak 150 kişi seçilmiştir. Seçilen kişiler içinde kadınların sayısının arasında olma ihtimali nedir? n = 150 30 p = 0,40 ~0,50 BU ŞARTLARDA BİNOM NORMAL DAĞILIMA YAKLAŞIR. =np=(150)(0,40)=60 np = 60 5 z = X - np Dağılımın ortalaması =nxp =150x0,40=60 Standart sapması √nxpxq . √(N-n).(N-1) √150x0,40x0,60=6 npq (56-0,5) - 60 Z1= = - 0,75 TABLODAN 0,2734 6 (70+0,5) -60 Z2= = 1,75 TABLODAN 0,4599 6 + 0,7333 Seçilen kişiler arasında bayanların sayısının arasında olma ihtimali %73.33’tür.

190 Selami ÖZCAN İstatistik
Örnek 2: Bir fabrikada üretilen mamullerin %10 hatalı, 150 birim alınıyor, 10 mamulun hatalı olma ihtimali kaçtır? Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq . √(N-n).(N-1) √150x0,10x0,90=3,67 X= 10 değerine ±0,5 ilave edilirse; X1=10,5 X2=9,5 Z1=10,5-15/3,67=-1,23 Z2=9,5-15/3,67=-1,50 P(x=10)=P(-1,5<z<-1,23) P(z)=0,4332-0,3907=0,0425 Örnek 3: bir önceki örneğe göre 10 dan az olma ihtimali kaçtır? (10 hariçtir) X=9,5 standart z değeri=-1,5 P(x<10)=P(z<-1,5)= 0,5-0,4332=0,0668 Selami ÖZCAN İstatistik

191 POİSSON DAĞILIMININ NORMAL’E YAKLAŞIMI
Poisson dağılımında  Parametresi, =np≥5 eşitliğine uygun olması durumunda Poisson dağılımı normal dağılıma yaklaşır. Bu Durumda ihtimallerin Hesaplanmasında; P(x=k) = e -  k k! X -  X -  z = = √ Formülü yerine = 2 =  =nxp eşitliğinden istifade ederek

192 Örnek 1: Bir hastalığın iyileştirilmesi için geliştirilen yeni bir ilaç hasta üzerinde uygulanmıştır. İlacın yan etkisinin olması ihtimali 0,002 dir. Buna göre ilacın verildiği hastalarda yan etkisi görülenlerin sayısının arasında olma ihtimali nedir? n= 20000 p= 0,002 = =np=20000(0,002)=40 5 olduğundan poisson dağılımı normale yaklaşır. V(X)=  = 40 X -  z1 = = = = - 0,1 0,0398 40 X -  z2= = = 0,5 0,1915 40 + 0,2313

193 Selami ÖZCAN İstatistik
Örnek 2: fabrika malzeme yokluğu sebebiyle günde 12 kez durmaktadır. Rastgele seçilen bir günde malzeme yokluğu sebebiyle günde 15 ve daha az durma ihtimali kaçtır? =12 ise z=15,5-12/√12=1,01 P(x≤15)=P(z≤1,01)=0,5+0,3438=0,8438 Örnek 3: bir önceki örneğe göre günde 12 kez durma ihtimali kaçtır? X1=11,5 X2=12,5 Z1 =11,5-12/√12=-0,14 Z2=12,5-12/√12=0,14 P(x=12)=P(-0,14<z<0,14)=0,0557+0,0557=0,1114 %11,14 Selami ÖZCAN İstatistik

194 HİPERGEOMETRİK DAĞILIMIN NORMALE YAKLAŞIMI
Nxp≥5 olduğunda hipergeometrik dağılım normale yaklaşır. Sınırlı anakütleden iadesiz çekilişler yapıldığı için standart sapma düzeltme faktörü ile çarpılır. Standart z formülündeki anakütle ortalaması ve standart sapma yerine hipergeometrik dağılımın ortalama ve standart sapması yazılarak ihtimal dağılımı hesaplanır. Z= (x-np)/ √npq . √(N-n/N-1) x değişkeni süreklilik düzeltmesine tabi tutulur. Selami ÖZCAN İstatistik

195 Hipergeometrik dağılımın normale yaklaşımına Örnekler
Örnek 1: 1000 mamulun %10 hatalı, iadesiz alınan 150 adetin ise 8 den az olma ihtimali kaçtır. Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq . √(N-n).(N-1) σ=√150x0,10x0,90 x √( )/(1000-1) σ=3,39 8 den az dendiği için 7,5 Z=7,5-15/3,39=-2,21 P (x<8) =P(Z<-2,21)=0,5-0,4864=0,0136 %1,36 Örnek 2: 1.Örneğe göre 10 ve daha fazla olma ihtimali kaçtır? (10 ve yukarısı başlangıç 9,5) Z= 9,5-15/3,39= -1,62 P(x≥10)= P(z ≥-1,62)=0,4474+0,5= =0,9474 %94,74 Selami ÖZCAN İstatistik


"27.04.2017 İSTATİSTİK I Doç. Dr. Selami ÖZCAN." indir ppt

Benzer bir sunumlar


Google Reklamları