Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

İSTATİSTİK I Doç. Dr. Selami ÖZCAN. 01.03.2016Selami ÖZCAN İstatistik 2 BİRİNCİ BÖLÜM İSTATİSTİKLE İLGİLİ İSTATİSTİKLE İLGİLİ TEMEL KAVRAMLAR.

Benzer bir sunumlar


... konulu sunumlar: "İSTATİSTİK I Doç. Dr. Selami ÖZCAN. 01.03.2016Selami ÖZCAN İstatistik 2 BİRİNCİ BÖLÜM İSTATİSTİKLE İLGİLİ İSTATİSTİKLE İLGİLİ TEMEL KAVRAMLAR."— Sunum transkripti:

1 İSTATİSTİK I Doç. Dr. Selami ÖZCAN

2 Selami ÖZCAN İstatistik 2 BİRİNCİ BÖLÜM İSTATİSTİKLE İLGİLİ İSTATİSTİKLE İLGİLİ TEMEL KAVRAMLAR

3 Selami ÖZCAN İstatistik 3 1. Bölüm: Sunum Planı İstatistiğin Doğuşu, Gelişimi İstatistik nedir? Ve kaça ayrılır? Anakütle ve örnek; istatistik ve parametre nedir? İstatistiksel örnekleme yöntemleri kaça ayrılır? Değişken nedir ve kaça ayrılır? Veri toplama yöntemleri Veri Derleme:Verilerin düzenlenmesi Ölçme nedir? Kaç çeşit ölçek vardır?

4 Selami ÖZCAN İstatistik 4 İstatistiğin Doğuşu İstatistik başlangıçta teknik bir disiplin olarak ele alınırken günümüzde bir bilim dalı olarak kendini kabul ettirmiş, ulusal ve uluslararası boyutta gelişmelerin temelini oluşturmuştur. Son 30 yıla damgasını vuran ve çağımızda bilgi çağı olarak adlandırılan gelişmeler istatistiği evrensel bir konuşma dili haline getirmiştir. Günümüzde ulusal ve uluslararası sosyal ve ekonomik gelişme hedeflerinin belirlenmesi ve bu hedeflerin başarısı güncel, güvenilir istatistiklerle sağlanmaktadır. Doğru bilgi, doğru yorum ve doğru karar sürecinde araştırmacılar, politikacılar, karar alıcılar ve tüm bireyler çalışmalarında istatistiki bilgileri etkin olarak kullanmaktadırlar. İlk çağda bile insanlar bazı toplu olayları belirleme ihtiyacı duymuşlardır. Devletlerin kurulması ile birlikte insanlar sınır belirleme, vergi toplama, toprak dağılımına yönelik amaçlarla ayrıca dil, din farkı olan toplulukların nüfus büyüklüğünü belirleme, askere alma amaçlı bilgiler toplamaya ve bunların kayıtlarını tutmaya başlamışlardır. Orta çağda devletler güçlerini yitirmiş, istatistik konusu gerilemiş ve kent düzeyinde bazı bilgilerin toplandığı değerlendirmelerle sınırlı kalmıştır. Devletlerin güçlenmesi ile birlikte istatistik uygulamaları gelişmiş ve nüfus sayımları yanında; dış ticaret, milli gelir hesabına yönelik fiyat, ücret vb. temel verilerin toplanmasına başlanmıştır. Devletlerin Durumu nüfus İstatistik metodolojisine yönelik çalışmalar 17. yüzyılda Alman Üniversitesinde "Devletlerin Durumu" adlı bir derste bilimsel olarak gündeme gelmiştir. Derste ülkelerin tarihi, mali, askeri yönetim örgütleri, nüfusları sayılarla ifade edilerek ele alınmış ve bu konu sonradan istatistik olarak adlandırılmıştır. Aynı dönemde sigorta matematikçileri nüfus konusu ile ilgilenmeye başlamışlardır.

5 Selami ÖZCAN İstatistik 5 İstatistiğin Gelişimi Pascal, Bernouilli, Moivne, Laplace, Poisson ve Gauss ihtimal teorisiçan eğrisi 17. yüzyılda Pascal, Bernouilli, Moivne, Laplace, Poisson ve Gauss tarafından yapılan çalışmalar ile ihtimal teorisi, talih oyunları ve tesadüfi olayların çan eğrisi şeklinde dağılım gösterdiği belirlenmiştir. Aynı yüzyılda Belçikalı matematikçi ve astronom Quatelet istatistik sorunlarına eğilmiş, çeşitli eserler yazmıştır. İstatistik Genel Müdürü olan Quatelet istatistiğin kullanım alanını genişleterek kültür, ahlak, doğal olaylar ve özellikle antropometriye yönelik bilgileri değerlendirmiştir. Orta Asya da büyük uygarlıklar kuran Türk toplumları Hindistan'da, Çin'de, İran'da bilgiye önem vermişler, İlhanlılar ve Selçuklular nüfus sayımı çalışmaları yapmışlardır. İstatistikleri tarihi perspektifte değerlendirmek, geçmişi daha iyi anlamak, günümüzü en etkin yapıda kavramak ve geleceğimizi en iyi şekilde planlamamız açısından da çok büyük önem taşımaktadır bilgi kaydetme 17. Yüzyıla kadar sadece bilgi kaydetme şeklinde gerçekleşen istatistiki çalışmalar, FisherPearson Gosset'in 18. ve 19. Yüzyıllarda J. Bernoulli ( ) ve K.Gauss'un ( ) katkılarıyla matematik temelleri üzerine oturtulmuş, ihtimal teorisi geliştirilmiştir. Sosyal ve antropolojik olaylara istatistiği kapsamlı bir şekilde uygulayan ilk matematikçi olan Adolphe Quételet ( ) ise modern istatistiğin kurucusu olarak kabul edilmiştir. 20. Yüzyılın başında R. A. Fisher, K. Pearson ve W. S. Gosset'in katkılarıyla tahmin yapma ve karar verme konuları ön plana çıkarak istatistik artık sayısal verilerin yorum ve değerlendirmesini yapan bir bilimsel metodlar topluluğu haline gelmiştir.

6 Selami ÖZCAN İstatistik 6 İSTATİSTİK BİLİMİ NEDİR? İstatistik sözcüğü, ele alınan olayların gözlemlenerek ilgili verilerin derlenmesi, işlenmesi, analizi ve yorumlanmasında kullanılan tekniklerin tümünü ifade eder. Dar manada İstatistik: geçmiş ve şimdiki durumla ilgili toplanmış sayısal verileri, geliştirilmiş olan bazı tekniklerle analiz ederek gelecek hakkında karar vermemizi kolaylaştıran bir bilim dalıdır. Geniş Manada İstatistik: belirli amaçlar için verilerin toplanması, düzenlenmesi, uygun yöntemlerle analiz edilmesine denir. Bu analizler vasıtasıyla elde edilen sonuçların YORUMLANMASI ve Bir KARARA bağlanması istatistikle ilgilidir. İSTATİSTİK İSTATİSTİK: Belirlenen amaç/lar doğrultusunda gözlenen yığın olaylardan derlenen sayısal verilerin işlenerek, ilgili olayların oluşturduğu yığınların bilimsel olarak incelenmesinde kullanılan teknik ve yöntemler bilimidir. Rakamlar yalan söylemez, yalancılar rakam söyler. Üç türlü yalan vardır. Yalan, kuyruklu yalan, İstatistiki yalan Rakamsal Bilgileri Anlamlandırmak, Belirsizlik ile İlgilenmek, İlişkileri analiz etmek Tahmin, Belirsiz Ortamda Karar Verme belirli bir olaya ilişkin derlenmiş sayısal bilgiler İstatistik kelimesi ilk olarak Almanya’da devlet anlamına gelen status kelimesine dayanılarak kullanılmaya başlanmıştır. Günlük dilde istatistik veya istatistikler; belirli bir olaya ilişkin derlenmiş sayısal bilgiler demektir.İthalat, ihracat, turizm ve inşaat vb. istatistikler bazen sayı ve rakam karşılığında da istatistik kullanılır

7 Selami ÖZCAN İstatistik 7 (konuları açısından) İstatistik ikiye ayrılır 1. Deskriptif (tasvir edici-tanımlayıcı) istatistik genel dağılımı ortaya çıkarma, durumu olduğu gibi tasvir etme, kollektif olayların eğilimini araştırır, verilerin özetlenmesi ve tasvir edilmesi ile ilgilidir. 1. Frekans dağılımları 2. Merkezi Eğilim (Yer) ölçüleri 1. Parametrik MEÖ 1. Aritmetik ortalama 2. Geometrik ortalama 3. Harmonik ortalama 4. Kareli ortalama 2. Parametrik olmayan MEÖ 1. Mod 2. Medyan 3. kantiller 3. Dağılım ölçüleri 1. Parametrik dağılım ölçüleri 1. Ortalama sapma 2. Standart sapma 3. Standart hata 4. Varyans 2. Parametrik olmayan dağılım Ölçüleri 1. Değişim aralığı 2. Kartil aralığı 3. Desil aralığı 4. Çarpıklık ve Basıklık 5. İhtimal (toplama, çarpma) 6. İhtimal dağılımları 1. Kesikli ihtimal dağılıları 1. Binom dağılımı 2. Poisson dağılımı 3. Hipergeometrik dağılım 2. Sürekli ihtimal dağılımları 1. Normal dağılım 1. Standart normal dağılım 2. Normalin Binoma yaklaşım 2. İndaktif (tahlil edici-çıkarımcı) istatistik Çıkarımlar mutlak doğru olmadığı için ihtimal kelimesi ile ifade edilir, ileri seviye istatistik bilgisi gerektirir, tümevarım yöntemi kullanılır. Hipotez testlerini içerir. 1. Örnekleme teorisi 1. Ortalama 2. Oranlama 2. Tahmin teorisi (güven sınırları) 1. Oran 2. Ortalama 3. Hipotez testleri 1. Tek yönlü 2. Çift yönlü 4. Varyans Analizi 5. Regresyon analizi 1. Basit 2. Çoklu 6. Zaman serileri 7. Korelasyon 8. Non parametrik testler 9. İndeksler 10. Kalite Kontrol

8 Selami ÖZCAN İstatistik 8 Tipik Olay ve Yığın Olay İstatistik ve Parametre Yığın Olay: bir olaylar kümesinde tek bir olay kümedeki diğerlerini veya ait olduğu kümeyi tam olarak temsil edemeyen olaylardır. İstatistik yığın olaylarla ilgilenir. Trafik kazaları, evlenmeler, boşanmalar, doğum ve ölüm oranları, yıllık satışlar, ciro vb. Tipik Olay: bir olaylar kümesinde tek bir olayın tüm olaylar kümesini temsil ettiği olaylara denir. Laboratuarda suyun elde edilmesi, Parametre: ana kütledeki bütün birimler üzerinden hesaplanan ölçülere denir. İstatistik: ana kütleyi temsil etme gücüne sahip bir örnekteki verilerden hesaplanan ölçülere denir.

9 Selami ÖZCAN İstatistik 9 1.Birim (Örnek), birim türleri ölçülmesisayılması 1. Birim (Örnek/örneklem): yığın olay niteliğindeki her olaya denir. Ana kütleden tesadüfi yöntemlerle seçilerek oluşturulan yeni oluşuma denir. Birim olması için bir nesne/olayın ölçülmesi veya sayılması yeterlidir. Mesela elle tutulamayan ve gözle görülemeyen, ölçülemeyen ve sayı ile ifade edilemeyen soyut (sevinç, korku, aşk, üzüntü, melek gibi) olaylar birim oluşturmaz. Fakat doğum, ölüm, trafik kazası, insan, hayvan, bina gibi sayılabilen ve ölçülebilen canlı ve cansız varlıklar ile olaylar, sayılarla ifade edildiği için birim oluşturlar. Birim (örnek) Türleri: 1. Maddi birim ve Gayri maddi birim: okul, insan, buzdolabı, araçlar (uzunluk, genişlik ve yükseklik) gibi bir boyuta/varlığa sahip olan, elle tutulup gözle görülebilen somut varlıklar (insan, araba)-Maddesel varlığı (boyutları) olmayan fakat gerçekte olan birimlerdir. Mesela Boşanma, evlenme, doğum, ölüm, trafik kazası gibi 2. Sürekli birim ve Ani birim: belirli bir zaman aralığı (herhangi bir anı) içinde gözlemlenen birimler sürekli: (insan, ticari kuruluş, konut, araçlar sürekli birimlerdir ) bir olay bir fiil biçiminde çıkan oldukça kısa süren(zaman içine dağılmış) birimler ani: Belirli bir anda çıkan ve ancak ortaya çıktıkları anda incelenebilen, maddesel varlığa sahip olmayan birimlerdir. Evlenme, boşanma, trafik kazası, ölüm ani birimlerdir 3. Doğal birim ve Yapay birim: bir bütün oluşturan, parçalanmaları/birleştirilmeleri halinde özelliklerini kaybeden birimlere doğal: (tek parça olarak incelenen olaylar, Örneğin masa, araba, insan, kalem doğal birimlerdir), bir bütün olma özelliği göstermeyen fakat nitelikleri değişmeyen birimlere yapay birim denir. (arsanın parçalara ayrılması, kumaş parçalara ayrılırsa özelliğini kaybetmez ) 4. Gerçek birim ve Gerçek farz edilen (varsayılan) birim: maddesel olarak veya fiil biçiminde var olan birimler gerçek, ortaya çıkmış olması yeterli: Ev, araba, bina, masa maddesel varlığa sahip gerçekte var olan birimleri oluştururken, ölüm, evlenme, doğum, trafik kazası gibi maddesel bir varlığa sahip olmayan ama gerçekte var olan birimler gerçek birimleri oluşturur, gerçekte olmayan varsayılarak oluşturulan birimler. 10 öğrenciden 3 lü grup oluşturmak gibi

10 Selami ÖZCAN İstatistik Ana kütle, Ana kütle türleri 2. Ana kütle (istatistik kütlesi): yığın olay niteliğindeki aynı cins birimlerin oluşturduğu topluluğa denir. Veya bir istatistiki araştırmada araştırmaya konu olan bütün birimler aynı nedenlerin etkisinde olması gerekir. Anakütle, istatistik birimleri toplamından farklı bir yapıya sahip olmamalıdır. Üniversite öğrenci ve hoca toplamından farklı bir tüzel kişiliğe sahiptir. Ana kütle türleri: 1. Gerçek anakütle, farazi (varsayılan) anakütle, gerçek birimlerin oluşturduğu anakütle, henüz oluşmamış fakat oluşturulması mümkün olan anakütle varsayılandır. 30 kişilik bir sınıfta rastgele seçilecek 5 kişilik bir grup c(30:5)=142.4 farklı şekilde olur. 2. Sonlu veya Sonsuz anakütle: sayılabiliyorsa sonlu, sayılamıyorsa sonsuz, Türkiye’de yaşayan kişiler sonlu, Marmara’daki canlı sayısı sonsuz. 3. Sürekli veya Kesikli anakütle: parçalandıklarında ve birleştirildiklerinde özelliğini kaybediyorsa kesikli(doğal birimlerden oluşur), kaybetmiyorsa sürekli anakütle(zaman ve mekan birimleri doğal değildir.) ANAKÜTLEÖRNEK Mesela: bir üniversite öğrencileri üzerinde bir araştırma yapılacaksa Üniversitenin bütün öğrencileri ANAKÜTLE, bu öğrenciler arasından seçilen 100 kişilik şans grubuna ÖRNEK denir. Şayet araştırma İİBF bütün öğrencilerine yönelik bir araştırma yapılıyorsa okulun toplam öğrenci sayısı ana kütleyi oluşturur, içinden tesadüfi olarak seçilen 30 öğrenci örnek kütleyi oluşturur. Not: bir istatistiksel araştırma planlanırken araştırmanın nerede yapılacağı, kimlerle/kimler tarafından yapılacağı, ne kadar zamanda yapılacağı, araştırma için ayrılan kaynaklar, toplanacak veriler çok önemlidir.

11 Selami ÖZCAN İstatistik 11 VERİ DERLEME (düzenleme) VERİ DERLEME: belirlenen amaçlar doğrultusunda gözlemlenecek birimlerin ölçülmesi, sayılması sonra da bunların ilgilenilen değişkenlere göre hangi şıklara sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içerir. A. Birim Seçimi: belirlenen amaç/lar doğrultusunda ilgilenilen yığın olayın tanımlanmasıyla seçme işlemi gerçekleşir yani ilk önce kimlerin veya nelerin gözleneceği belirlenir. B. Değişken ve Şıkların Belirlenmesi sonlu 1. Değişkenin Belirlenmesi: Veri derlenirken sadece belirlenen amaçlar doğrultusunda değişkenler göz önünde tutulur. Ayrıntı sorunlara neden olabilir. Gözlem sayısı sonlu bir sayı olmalıdır. şık 2. Şıkların Belirlenmesi: şık, belirli bir özelliğin ortaya çıkış şekillerine denir. Gözlemlerde kullanılan ölçü biriminin araştırmaya uygun olması gerekir. Tabi ki şıkların alacakları değerler de (ilgilenilen değişken sürekli veya kesikli olsun fark etmez) sonlu olmalıdır. Şıkların aldığı ölçü birimleri de ilgilenilen olaya uygun olmalıdır. Kilo, şişe, teneke, gram vb C. Anakütlenin Sınıflandırılması Veriler hangi yöntemle toplanırsa toplansın, elde edilen veriler genellikle istatistiksel analize hazır değildir (bu veriler ham veri olarak adlandırılır) Bu verilerin analize uygun hale getirilmesi için düzenlenmeleri gerekir. Veri Derleme Türleri: 1. Ani ve sürekli veri derleme: sürekli birimlerin belli bir andaki durumlarını gözlemlemek için yapılan derlemelere ani derleme; ör: nüfus ve işyeri, tarım ve sanayi sayımları sayılabilir. Sürekli veri derleme,olayların aynı anda ve bir arada meydana gelemedikleri durumda sürekli olarak incelenmesidir. Anlık birimlerin belirli bir zaman aralığında gözlemlenmesidir. belirli bir bölge ve zamanda evlenme, boşanma, trafik kazası oranları 2. Direkt ve Endirekt veri derleme: doğrudan ana kütle birimlerinin gözlemlenmesi durumunda direkt;söz konusu anakütle ile birlikte diğer anakütle birimlerinin gözlemlenmesi durumu ise endirekt veri derlemedir. Doğrudan nufus sayımı ile ülkede yaşayan sayısı tespit edilebileceği gibi bunun yanında konut sayımı ile de nufus tespiti yapılabilir. 3. Birincil ve İkincil veri derleme: bilgi edinmek için yapılan derlemelere birincil (anlık), idari ve mali amaçlarla yapılan derlemelere ikincil (sürekli) veri derleme denir. 4. Asıl ve yardımcı şeklinde veri derleme: anakütleyi oluşturan birimlerin özelliklerinin belirlenmesi amacıyla yapılan derlemeye asıl, asıl derlemeye yardımcı olmak için yapılan derlemeye yardımdı denir. 5. Genel ve kısmi veri derleme: bilgi edinilmek istenen kütlenin tamamının gözlenmesine genel veri derleme, genel nüfus sayımları vb.; bilgi edinmek istenen kütleyi oluşturan birimler arasından belirlenen amaçlar doğrultusunda yanlızca bir kısmının seçilip gözlenmesine kısmı veri derleme denir. Pahalı oluşu, zaman alışı, gözlem birimlerinin fiziksel zarara uğraması vb nedenlerle kısmi veri toplanır. ÖRNEKLEM Kısmi veri derleme: ÖRNEKLEM (örneği oluşturmak için anakütleden seçilen birimlerin oluşturduğu topluluktur. Topluluğu oluştururken seçilen teknikler şunlardır: eşit – Rassal (tesadüfi)örneklem : anakütledeki her bir birimin örneğe girme şansı eşit ise rassal örnekleme – İradi (isteyerek) örneklem: girmesi mümkünler arasında eşit şans gözetilmez/ fark gözetilirse olur. (7.bölümde ayrıntılı anlatılacaktır.)

12 Selami ÖZCAN İstatistik 12 Değişken nedir? Kaça ayrılır? Değişken (Özellik): gözlemden gözleme değişik değerler alabilen objelere, özelliklere veya durumlara denir. İstatistik birimlerin sahip oldukları özellikler değişken,değişkenlerin aldıkları değerlere ise şık tır Doğum yerleri, yaş, ağırlık, uzunluk vb. özellikler değişkendir. Aldıkları değerlere de şık denir. Değişken Türleri: 1.Mekan değişkeni:değişkenin şıklarının mekana göre oluştuğu değişkenlerdir. Doğum yeri, Üniversitenin kurulduğu şehir vb., 2.Zaman değişkeni:değişkenin şıklarının zamana göre oluştuğu değişkenlerdir. Doğum yılı, Üniversitenin kuruluş yılı vb. 3.Maddi değişkeni:mekan ve zaman değişkenin dışındaki değişkenler. İnsanların medeni hali, birim değişken maliyetler, istatistikten alınan notlar vb. 1. KALİTATİF (Sayısal olmayan) değişkenler Değişik derecelerde az veya çok değerler alan değişkenlerdir. Ör: doğum yeri, göz rengi, ırk, nüfus, cinsiyet, medeni durum, din vb. 2. KANTİTATİF (Sayısal) değişkenler Gözlemden gözleme farklılık gösterirler fakat bu farklılık derece yönünden değil kalite, miktar ve çeşit yönündendir. Ör: yaş, ağırlık, zeka seviyesi, hava sıcaklığı, Hesabınızdaki bakiye, sınıftaki öğrenci sayısı vb.

13 Selami ÖZCAN İstatistik 13 DEĞİŞKENLERİN SINIFLANDIRILMASI VERİ KALİTATİFKANTİTATİF KESİKLİSÜREKLİ bir ailedeki çocuk sayısı bir yılda satılan bilgisayar sayısı bir kişinin kilosu bir kişinin boyu

14 Selami ÖZCAN İstatistik 14 KANTİTATİF (SAYISAL) DEĞİŞKENLER 1. Kesikli değişkenler (yalnız belirli tamsayı değerleri alabilen) Sayılabilen değişkenler Ör: cinsiyet, medeni durum 2. Sürekli değişkenler (belirli aralıkta sonsuz sayıda değer alabilen değişkenlere denir) Ölçülen ve tartılan değişkenler Ör: yaş, uzunluk ve ağırlık vb

15 Selami ÖZCAN İstatistik 15 Veri kaynakları, Veri toplama araçları ve yöntemleri Veri toplama yöntemleri Anket (yazılı iletişim) – Geleneksel cevaplayıcının yönettiği, – Posta – Faks – Elden bırakıp alma araştırmacının yönettiği – Telefonla anket – Biçimsel olmayan mülakat – Modern e posta anketi İnternet anketi Mesajlaşma Gözlem (olayların ortaya çıktığı sırada sistematik biçimde inceleme tekniğidir) – Katılımlı gözlem – Dışarıdan gözlem Doğal gözlem Simülasyon gözlemi(kişi/grup oyun) Görüşme: tek tek veya grup ile sözlü veya hareketli iletişim yoluyla veri toplama yöntemidir. Deney Veri Kaynakları Birincil Veriler – Anket – Gözlem (örnek olay) – Mülakat İkincil Veriler – Dokümantasyon (yazılı) – Çok kaynaklı (alan çalışması, zaman serileri) – Anket (sayımlar ve anketler) Veri Toplama Araçları Veri Toplama Araçları – Soru kağıdı (anket formu) Açık uçlu sorular (size göre…) Kapalı uçlu sorular (evet, hayır) – Anketör (gözlemci) Ücretli, gönüllü zorunlu Devamlı, geçici

16 Selami ÖZCAN İstatistik 16 Ölçme ve Ölçekler Ölçme: nesne veya fertlere belirli bir özelliğe sahip oluş derecelerini belirtmek için belirli kurallara uyarak sembolik değerler verme işlemine denir. İstatistiki bir araştırmaya konu olan verileri ölçmeye yarayan ölçekler 4’e ayrılır. 1. Nominal(sınıflama) ölçek: istenen özelliğin olması(1) olmaması(0) hatalı-hatasız, kız-erkek, likert 2. Ordinal (sıralama) ölçek: yarışmacıların sıralanması 1., 2., 3., veya 1. tercih, 2. tercih, likert tipi sıralama, hiç beğenmedim(1) beğenmedim(2) biraz beğendim(3), beğendim(4), çok beğendim(5) 3. Aralık ölçeği: belirli iki değer arasında sonsuz değer alır. Bu durum için aralıklar belirlenir. 500 altı, ytl, ytl, ytl, 2001 ve üzeri 4. Oran ölçeği: ağırlık ve boy ölçüleri, metre, kg gibi

17 Selami ÖZCAN İstatistik 17 Ölçeklerde Uygulanabilecek İstatistikler ÖlçeklerMukayeseOrtalamaÖrnekler NominalKimlikMod Cinsiyet, göz, saç rengi, meslekler, araba plakaları, forma no vb. OrdinalSıralamaMedyan Marka tercihi, sosyal sınıflar, bölüm tercihi, ilk 500 firma vb. İnternalAralıkAritmetik Sıcaklık ölçeği, başarı puanı, markaya karşı tutum, vb. RasyoOranTüm işlemler Satış miktarı, müşteri sayısı, ağırlık, zaman, mutlak değer olan herşey

18 Selami ÖZCAN İstatistik 18 ANALİZ TEKNİKLERİ 1. DEĞİŞKEN SAYISINA GÖRE – Tek değişkenli (değişken üzerinde değişik grupların veya cevapların dağılımı) t testi, z testi, ki kare, one way anova testi, mann whitney u testi – Çok değişkenli (bağımlı ve bağımsız değişken) korelasyon, regresyon, faktör, ayrım ve kümeleme analizi 2. AMAÇLARA GÖRE – Farklılıkların tespitine yönelik t testi, ki kare testi, z testi, anova testi – İlişkilerin şiddetini ölçmeye yönelik Bağımlılık ölçümü

19 Selami ÖZCAN İstatistik 19 ANALİZ TEKNİKLERİ 3.Veri Özelliklerine Göre Parametrik analiz teknikleri ve ön şartları – z testi: örnek büyüklüğü n>=30 – t testi: örnek büyüklüğü n<30 – F testi: varyans analizi – Ki kare testi – Anova testi – One way anova – Korelasyon – Regresyon – Çok değişkenli analiz teknikleri Ön şartları – Verilerin aralık/oran ölçeğinde ölçülmüş olması gerekir – Veriler normal dağılım göstermeli – Hedef kitlede yer alan bütün gruplar aynı varyans değerine sahip olmalı – Hata değerleri tesadufi olmalıdır Parametrik olmayan analiz teknikleri – Tek örnek durumu için İşaret testi K S testi Run testi – Eşlenik çift örnek durumu için İşaret testi Wilcoxun eşlenik testi – İki bağımsız örnek durumu için Mann Witney U testi (t testi ile aynı) Wilcoxin sıra toplam testi Wilcor sıra sayıları testi K S testi – İkiden fazla örnek durumu için Kuruskev Walls testi Frigman testi

20 Selami ÖZCAN İstatistik 20 İKİNCİ BÖLÜM İSTATİSTİK SERİLERİ (FREKANS DAĞILIMLARI) İSTATİSTİK SERİLERİ (FREKANS DAĞILIMLARI) Niçin frekans dağılımı yapılır? Niçin frekans dağılımı yapılır? – Veriyi gruplara ayırarak anlaşılabilir hale getirmek için – Gözlenme sıklıklarını ve ihtimallerini belirlemek için

21 Selami ÖZCAN İstatistik 21 2.Bölüm: Sunum Planı Seri türleri Kantitatif seriler – Zaman ve mekan serileri – Frekans dağılımları – Kümülatif seriler – Birleşik seriler Kalitatif seriler Serilerin grafikle gösterimi

22 Selami ÖZCAN İstatistik 22 İstatistik serileri İstatistik serileri : gözlem değerlerini (ham verileri) anlamlı kılma (büyüklüklerine göre sıralama) yollarından biridir. Seriyi oluşturan gözlem değerlerinin her birine terim denir. Kütleyi oluşturan kollektif olayların her birine birimdir. Terim ise birimleri oluşturan gözlem değerlerinden her biridir. Terim sayısı ile birim sayısı birbirine eşit olur. Seri türleri 1. Kantitatif seriler – Zaman ve mekan serileri: gözlem sonuçlarının (yıl,ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman; yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. – Frekans Serileri: bu serilere bölünme, dağılma serileri de denir. Ham verilerin basit seri, frekans serisi ve sınıflandırılmış/gruplandırılmış seri şekline dönüştürülmesidir. – Kümülatif (birikimli) seriler: – Bileşik seriler: gözlem değerlerini iki veya daha fazla değişkene göre hir araya getiren serilere denir. Aylık gelir ve gider arasındaki ilişkinin ölçülmesi 2. Kalitatif seriler (dikey eksende frekanslar, yatay eksende sınıf veya grup değerlerinin yazıldığı grafik şeklidir. Simetrik:normal dik ve basık seriler), asimetrik(sağa ve sola eğik) seriler; çok tepeli ve J/ters J şeklinde seriler ve U şeklinde seriler vardır. Verilerin grafikle gösterilmesi – Basit serinin grafikle gösterilmesi: Çubuk grafiği – Sınıflandırılmış serinin grafikle gösterilmesi: Histogram, Frekans poligonu, – Birikimli (kümülatif)serilerin grafikle gösterilmesi – Bileşik serilerin grafikle gösterilmesi

23 Selami ÖZCAN İstatistik 23 Zaman ve mekan serileri ZAMAN SERİSİ: gözlem sonuçlarının (yıl, ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman serisi Yıllar Satışlar MEKAN SERİSİ: gözlem sonuçlarının yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. İller Satışlar İstanbul 8500 Ankara 3200 İzmir 4800

24 Selami ÖZCAN İstatistik 24 Frekans Dağılımları Ham veri : gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığınıdır. 1. BASİT SERİ: 1. BASİT SERİ: elde edilenen ham verilerin büyükten küçüğe veya tersi alt alta veya yan yana sıralanmasına denir. ÖRNEK1: Bir işletmede 25 çalışana verilecek çocuk yardımı ile ilgili bir araştırma yapılmaktadır. çalışanların çocuk sayıları aşağıda verilmiştir. Ham veri: 0, 1, 3, 3, 2, 1, 0, 8, 4, 2, 3, 2, 5, 0, 6, 3, 5, 4, 1, 3, 2, 2, 3, 1,4 Basit seri: 8, 6, 5, 5, 4, 4, 4, 3, 3, 3, 3, 3, 3, 2, 2, 2, 2, 2, 1, 1, 1, 1, 0, 0, 0 Örnek 2.Ham veriler Basit seri 2. FREKANS SERİSİ: f 2. FREKANS SERİSİ: basit seriyi özetlemek veya daha anlaşılır hale getirmek için yapılır. Frekans:tekrarlanma sayısıdır. Frekans serisi ise:gözlem değerlerinin yanına kaç kez tekrarlandığı yazılarak oluşturulan seridir. f harfi ile ifade edilir. ÖRNEK1: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz Xf Toplam 25.

25 Selami ÖZCAN İstatistik 25

26 Selami ÖZCAN İstatistik SINIF/GRUPLANDIRILMIŞ SERİ 3. SINIF/GRUPLANDIRILMIŞ SERİ Hesaplama kolaylığı için eşit büyüklükte sınıf/gruplandırılır. Grup aralığını gösteren “aralık katsayısı”nın bulunması için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini/istenen grup sayısına bölünür. Az sayıda grup veri kaybına, çok sayıda grup işlemlerin zorlaşmasına neden olur. İlgili kavramlar Sınıf Değeri/orta noktası: Her grub veya sınıf bir sayı ile temsil edilir. Bu sayı her grubun orta noktasıdır. Buna sınıf değeri denir. Bu sınıf değeri frekans serisindeki X değeri gibi işlem görür. alt ve üst sınıf uçlarının veya alt ve üst sınıf sınırlarının toplanıp ikiye bölünmesiyle elde edilir. Sınıf büyüklüğü veya aralığı: alt ve üst sınırlar arasındaki farka denir. h ile gösterilir. Başlangıç ve bitiş sınırları belirtilmeyen sınıflara açık sınıflar denir. Sınıf aralığı dar tutulursa sınıf sayısı artar frekans dağılımının anlaşılması zorlaşır. Geniş tutulursa sınıf sayısı azalır sonuçta dağılıma ait bazı değerler gizli kalır Uygulamada sınıf sayısı: 7-20 yada arasında olmalıdır. Sürekli gruplandırılmış seri: sınıf uçları sınıf sayısına eşitse yani bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlıyorsa sürekli gruplandırılmıs seri demektir. Sınıf sınırları: sürekli gruplandırılmış bir seride her sınıfın alt ve üst değerlerine denir. Sınıf uçları: Her sınıfın ilk rakamı alt sınıf ucu, son rakamı ise üst sınıf ucudur. Sınıf uçları sınıf sınırlarına eşittir. Kesikli gruplandırılmış seri: bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlamıyorsa kesikli gruplandırılmıs seri denir. sınıf sınırları: kesikli gruplandırılmış bir seride bir üst sınıfın alt ucundan bir alt sınıfın üst ucu çıkarılıp ikiye bölünerek elde edilir. Bu değer bütün alt sınıf uçlarından çıkarılır ve bütün üst sınıf uçlarına eklenir.

27 Selami ÖZCAN İstatistik 27 Sınıf /Grup Aralık Katsayı formülü: (en yüksek – en düşük) / istenen sınıf/grup sayısı Sınıf /Grup Sayısı formülü: eşitsizliği dikkate alınır. k sınıf sayısı n: toplam veri sayısı 3. Sınıf/ Gruplandırılmış seriye Örnekler Sınıf /Grup Aralık Katsayı formülü: (en yüksek – en düşük) / istenen sınıf/grup sayısı Sınıf /Grup Sayısı formülü: eşitsizliği dikkate alınır. k sınıf sayısı n: toplam veri sayısı ÖRNEK ÖRNEK: Daha önce frekans serisi olarak düzenlenen örneği 2 eşit aralıklı gruplandırılmış seri olarak düzenleyiniz. Frekans SınıflGruplandırılmış Xf Sınıflar frekans toplam: Top: sınıf olacak şekilde (94-28)/10=6,2yaklaşık 7 aralık katsayısı olur;28 dahil 7 sayarsak ilk sınıf olur...

28 Örnek1: 100 öğrencinin istatistik dersinden aldığı notlar aşağıdaki gibidir. Bu verilere göre 89, 57, 57, 93, 97, 65, 33, 71, 42, 85, 47, 63, 76, 49, 88, 82, 50, 62, 93, 39, 76, 84, 54, 87, 56, 39, 49, 70, 74, 77, 81, 99, 73, 48, 57, 89, 55, 73, 86, 35, 66, 79, 85, 72, 91, 39, 49, 84, 66, 58, 65, 81, 84, 43, 62, 95, 58, 64, 77, 93, 74, 68, 76, 65, 61, 81, 37, 45, 89, 22, 50, 68, 87, 51, 45, 89, 95, 87, 91, 43, 71, 93, 67, 49, 65, 96, 84, 79, 77, 80, 93, 65, 89, 99, 64, 53, 62, 86, 69 Bu verilere göre a. Notların değişim aralığını bulunuz. b. Bu verileri basit seri haline getiriniz. c. Bu verileri sınıf büyüklüğü 10 olacak şekilde gruplandırarak bir frekans dağılımı teşkil ediniz. İlk sınıf olsun d. 50 den az puan alan öğrenci sayısını bulunuz. e. 70 veya daha yukarı puan alan öğrenci sayısını bulunuz. f. C şıkkındaki sınıflandırmaya göre her sınıfa ait sınıf değerini ve sınıf sınırlarını bulunuz g. C şıkkındaki sınıflandırmaya göre bir histogram ve frekans poligonu çiziniz. h. “..den az kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramı ve ojiv eğrinisini elde ediniz. i. “..den çok kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramını ve ojiv eğrisini elde ediniz Selami ÖZCAN İstatistik 28

29 Çözüm1: a =77 b.. c. Sınıf frekanslar Selami ÖZCAN İstatistik d. 50 den az denildiği için =18 dir e. 70 ve daha fazla denildiği için =52 f. Sınıflar alt sınır üst sınır sınıf değeri/orta noktası ,5 29,5 24, ,5 39,5 34,5 g. Frekans ,5 29,5 39,5 49,5 59,5 69,5 79,5 89,5 99,5 h. “..den az küm.frekans 1, 7, 18, 30, 48, 64, 86, 100 “.. den çok küm.frekans 100, 99, 93, 82, 70, 52, 36, 14 den az den çok

30 Selami ÖZCAN İstatistik 30 Örnek 2: Yalova Termal otele 75 ay boyunca aylık gelen turistlerin sayısı aşağıdaki gibidir. Sınıf sayısı en az 8, en çok 15 olacak şekilde çetele tablosunu ve sınıflandırmayı ve sınıf orta noktasını bulunuz?

31 Selami ÖZCAN İstatistik 31 ÇÖZÜM2: 1. adım: Dağılımdaki en büyük ve en küçük değer bulunur. Örneğimizdeki en büyük değer 115, en küçük değer adım: En büyük değerden en küçük değer çıkarılarak dağılım aralığı bulunur. Değişim aralığı = En büyük değer- En küçük değer Dağılım aralığı= = ile adım: Dağılım aralığı bir kez 8'e bir kez 15'e bölünerek(sınıf sayısının en az 8, en çok 15 olmasını önerildiği için) sınıf aralığı saptanmaya çalışılır. 25÷8=3.1, 25÷15=1.6'dır. 1.6 ile 3.1 arasında herhangi bir değer sınıf aralığı olarak seçilebilir. Eğer sınıf aralığını 3 olarak alırsak yaklaşık 8-9 sınıf elde ederiz, sınıf aralığını 2 alırsak sınıf sayımız arasında olur. Burada sınıf aralığı 3 olarak alınmıştır. Sınıflar şu şekilde En küçük değer 90 olduğundan ilk sınıfın alt sınırı 90 ile başlatılmıştır. Tüm sınıf sayımız ise 9'dur. Bütün değerler sınıflamaya dahil edilmiştir. 4. Adım: Sınıflar saptandıktan sonra her bir değerin hangi sınıfa gireceğine bakılır. Örneğimizdeki ilk değer 115'dir. Bu değer sınıfına gireceği için bu sınıfın karşısına bir çizgi çizilir. Sonra geri kalan değerler teker teker ait oldukları sınıfın karşısına işaretlenir. Buna "Çeteleme" denir. Sonra çeteleler sayılır ve her sınıfın karşısına yazılır. Örnek dağılımımızın çetele ve sayı ile gösterilmesiSınıflar Sınıflar Çetele Frekans Sınıf Orta Noktası /// 3 (90+92)/2= ///// 5 = ///// /// 8 = ///// ///// // 12 = ///// ///// //// 14 = ///// ///// / 11 = ///// //// 9 = ///// /// 8 = ///// 5 =115 Toplam 75

32 Selami ÖZCAN İstatistik 32 Frekans serisi ve gruplandırılmış seriye örnek (4 sınıflı gruplar oluşturulacak) Frekans serisi X frekans Top 40 Gruplandırılmış seri Gruplar frekans Toplam 40

33 Selami ÖZCAN İstatistik 33 Frekans serisinin gruplandırılmış seriye dönüşümü 1.adım: En yüksek X değerinden en düşük X değeri çıkarılır sınıf sayısına bölünür. (16-5)/4= 2,75 (sınıf büyüklüğü) bu değer serideki en küçük değer (5)e kümülatif olarak eklenir. 2. adım: örnekteki frekans seriyi eşit aralıklı 4 sınıflı sürekli gruplandırılmış bir seri haline getirelim. 5+2,75=7,75 olur. Sürekli gruplandırılmış seri kesikli gruplandırılmış seri (aralık 3) grup f grup frekans nisbi frekans ilk aralık 5-7,75 6 4, 50-7,50 6 6/40 7,75-10, ,75-10, /40 10,50-13, ,00-14, /40 13,25-16, ,25-17,25 3 3/40 top 40 top 40 40/40 Sınıf sınırları: 5-7,75;7,75-10,50;10,50-13,25;13,25-16,00 Sınıf büyüklüğü: ,00=2,75 Sınıf değeri: (5,00+7,75)/2=6,375

34 Selami ÖZCAN İstatistik 34 Kümülatif (Birikimli) Frekanslar Bazı istatistiksel çalışmalarda bir frekans serisinde veya gruplandırılmış seride belirli bir değerden daha küçük veya daha büyük değer alan birim sayısının belirlenmesi gerekebilir. Bu durumlarda kümülatif frekanslar hesaplanır Her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan seriye KF denir...den az: küçükten büyüğe doğru oluşturulur...den çok: büyükten küçüğe doğru oluşturulur.

35 Selami ÖZCAN İstatistik 35 Kümülatif Frekans Dağılımları 1...den az kümülatif Frekans dağılımları 2...den çok kümülatif Frekans dağılımları 3...den az küm.nisbi frekans dağılımları 4...den çok küm.nisbi frekans dağılımları..den az küm.f...den çok küm.f. 7,75 den az 6 5,00 den çok 40 10,50 den az 6+20=26 7,75 den çok 40- 6=34 13,25 den az 26+11=37 10,50 den çok 34-20=14 16,00 den az 37+ 3=40 13,25 den çok 14-11= 3..den az küm.nisbi f...den çok küm.nisbi f. 7,75 den az 6/40=15 5,00 den çok 40/40=100 10,50 den az 26/40=65 7,75 den çok 34/40= 85 13,25 den az 37/40=92,5 10,50 den çok 14/40= 35 16,00 den az 40/40=100 13,25 den çok 3/40= 0,75 Sınıflar f 5-7,75 6 7,75-10, ,50-13, ,25-16, Sınıflar f 5-7,75 6 7,75-10, ,50-13, ,25-16,

36 Nüfus grupları(*1000 kişi) şehir sayısı(frekans) den az den az den az den az den az den az ve üzeri 2 Yukarıdaki tabloyu kullanarak ; a... den az küm. frekans ve.. den çok küm. frekansları bulunuz? b...den az küm.nisbi ve..den çok küm. nisbi frekansları bulunuz? c. Şehir nüfusu 6000 den az olan şehir sayısı kaçtır? d. Şehir nüfusu 8000 ve üzeri olan şehir sayısı kaçtır? e. Şehir nüfusu en az 5000 ve 8000 den az olan şehir nüfusu kaçtır? f. Histogram, frekans poligonu ve ojiv eğrilerini çiziniz? Selami ÖZCAN İstatistik 36 SORU 2015 verileri ile dünyadaki 30 büyük şehir nüfuslarına göre gruplandırılarak frekans dağılımları gösterilmektedir.

37 Çözüm a ve b şıkları...den az...den çok...den az...den çok Nüfus grupları(*1000 kişi) f küm. frekans küm.frekans küm.nisbi frekans küm.nisbi frekans den az /30= 30/30= /30= 24/30= /30= 18/30= /30= 14/30= /30= 8/30= /30= 6/30= 9000 ve üzeri /30=1.00 2/30= c. Nüfusu 6000 den az şehir sayısı 16 dır. d. Nüfusu 8000 ve üzeri olan şehir sayısı 6 dır. e. Nüfusu 5000 ile 8000 den az olan şehir sayısı 18- 8=10 dur. f Selami ÖZCAN İstatistik 37

38 Selami ÖZCAN İstatistik 38 BİLEŞİK SERİLER (Bağımlı/bağımsız) Birimlerin birden fazla değişkene göre dağılımlarını bir arada gösteren serilerdir. Bir bileşik serinin ilk sütunu değişkenin gözlem değerleri, diğer sütunda ise ilgili değişkenlerin ilk değerleri yer alır. Birim seçimi (öğrenci) Değişken (uzunluk ve ağırlık) Örnek: Öğrenci gözlem no Uzunluk(m) X Ağırlık (kg) Y

39 Selami ÖZCAN İstatistik 39 SERİLERİN GRAFİKLE GÖSTERİLMESİ HİSTOGRAM FREKANS POLİGONU

40 Selami ÖZCAN İstatistik 40 Frekans dağılımların grafikle gösterilmesi 1.DİYAGRAMLAR (Çubuk ve alan grafikleri) Çubuk grafiği, gözlem değerleri x=2, 4, 6, 8, 10 yatay eksen Dikey eksende frekans değerleri: 2, 4, 7, 3, 1 2.FREKANS POLİGONU – YATAY EKSEN – DİKEY EKSEN – BU KOORDİNAT SİSTEMİNE GÖRE OLUŞAN ŞEKİL

41 Selami ÖZCAN İstatistik 41 Histogram ve frekans poligonu, Histogram: dikdörtgenler dizisidir. Tabaları her bir sınıfın sınıf büyüklüğünü, yüksekliği ise frekansları gösterir Frekans Poligonu: dikdörtgenlerin üst kenarlarının orta noktaları birleştirilmek suretiyle elde edilen grafiğe denir. Başlangıç noktası ilk sınıftan bir önceki farazi sınıfın orta noktasıdır.bitiş ise son sınıftan sonraki farazi sınıfın orta noktasıdır. Her ikisinin kapsadığı alan birbirine eşittir. gruplar frekanslar ,00- 7,75 10,50 13,25 16, Frekans poligonu histogram

42 Selami ÖZCAN İstatistik 42 HİSTOGRAMA ve FREKANS POLİGONUNA ÖRNEK SınıflarFrekanslar (f) Sınıf aralıkları (h) Ayarlanmış frekanslar (f/h) /4= /4= /4= /4= /4= /4= sınıflar Ayarlanmış frekanslar Frekans poligonu

43 Selami ÖZCAN İstatistik 43

44 VERİ ANALİZİ 33 DEĞİŞKEN SİMETRİK HİSTOGRAM SAĞA ASİMETRİK HİSTOGRAM SOLA ASİMETRİK HİSTOGRAM HİSTOGRAM: Histogramlar; spesifikasyon ve sonuç arasındaki ilişkilerin araştırılmasında, normal olmayan verilerin belirlenmesinde, malzeme ve değişik verileri sınıflandırarak bir operasyonel- finansal sürecin içerisinde değişikliklere neden olan faktörlerin gözden geçirilmesinde kullanılmaktadır. FREKANSFREKANS FREKANSFREKANS FREKANSFREKANS

45 Selami ÖZCAN İstatistik 45 KÜMÜLATİF SERİLERİN GRAFİKLE GÖSTERİMİ Sınıflar : 0-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, Frekanslar: 3, = 100 den az ve den çok serileri oluşturunuz? Sınıflar yatay, frekanslar dikey ekseni gösterir. den az = 3, 15, 40, 70, 85, 95, 100 den çok=100, 97, 85, 60, 30, 15, den çok..den az

46 Selami ÖZCAN İstatistik 46 Bileşik serilerin grafikle gösterimi X Y

47 Selami ÖZCAN İstatistik 47 GRAFİKLER Araştırma sonucunda elde edilen ve düzenlenen verilerin daha kolay anlaşılabilmesi için gösterildiği şekillere grafik denir. Grafikler göze hitap ettikleri için, toplanan verilerin daha açık bir şekilde görülmesine ve yorumlanmasına yardımcı olur. Buradaki en önemli nokta grafiklerin açık ve anlaşılır biçimde çizilmeleridir.

48 Selami ÖZCAN İstatistik 48 Verilerin grafikle gösterilmesi Sütun/Bar grafiği Pasta grafiği Çubuk Çizgi Alan XY dağılımı Silindir Örnekler verilecek Radar grafiği Halka grafiği Hisse senedi Kabarçık Yüzey Koni grafiği Pramit grafiği

49 BAR GRAFİK İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır Selami ÖZCAN İstatistik 49

50 Diğer soru örnekleri Selami ÖZCAN İstatistik 50 Soru 1: Aşağıda 50 öğrencinin istatistik I dersinden aldığı notlar verilmiştir. Sınıf/Grup sayısı 10 olacak şekilde frekans tablosunu oluşturunuz?

51 Soru 2: Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline gelen toplam 911 çağrının 36 günlük dağılımını göstermektedir Selami ÖZCAN İstatistik 51

52 Soru 3: Aşağıdaki 60 adet veriyi önce basit seriye sonra frekans serisine dönüştürünüz? Selami ÖZCAN İstatistik 52 5,97,78,95,27,37,76,37,35,75,6 6,76,977,36,26,5 9,27,1 4,14,97,5 9,67,95,35,56,1 8,38,1 4,57,39,45,86,7 6,9 7,16,97,7 8,18,76,56,79,1 7,16,35,17,38,38,99,35,765,9

53 Soru 4: Bir fabrikada çalışan işçilerin aylık ücretleri ve bu ücreti alan işçilerin yüzde dağılımları şöyledir Selami ÖZCAN İstatistik 53 Aylık Ücret (*100 tl) İşçi Yüzdesi 1000 den az 17, , , , , , – , ve üzeri 3,6 Yukarıdaki tabloyu kullanarak ; a. 1.sınıf ne şekilde yazılmalıdır ki büyüklüğü 2.sınıfınkine eşit olsun? b. Aylık 4000 tl ve üzeri ücret alan işçilerin yüzdesi kaçtır? c. En az 3000 tl fakat 5000 tl den de az alan işçilerin yüzdesi kaçtır? d. Aylık ücreti 6000 den az olan işçilerin yüzdesi kaçtır? e. Yüzdeler toplamı neden %100 çıkmamıştır.?

54 SORU 5 X yılı verilerine göre çalışanların çalışma statüleri aşağıda gösterilmiştir. Sütun/bar ve pasta grafiklerini çiziniz? Ücretli çalışanlar Mevsimlik/Yevmiyeli çalışanlar İşverenler Kendi hesabına çalışanlar Ücretsiz/aile işçisi Toplam Selami ÖZCAN İstatistik 54

55 Soru 6: 30 adet borunun et kalınlıkları mm olarak ölçülmüş sırasıyla aşağıdaki değerler bulunmuştur Selami ÖZCAN İstatistik 55 4,45 4,65 4,84 4,85 4,95 4,95 5,05 5,05 5,05 5,24 5,25 5,25 5,25 5,25 5,25 5,35 5,44 5,44 5,44 5,44 5,55 5,55 5,55 5,55 5,65 5,65 5,75 5,85 6,15 6,25 a. Sınıf sayısı 10 olacak şekilde sınıf aralığını bularak sınıfları oluşturunuz. b. Sınıf alt ve üst sınır uçları ile sınıf değerlerini bulunuz. c. Histogram ve frekans poligonunu çiziniz.

56 Soru 7: İŞL 243 dersi ara sınav notları (n = 38) a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını sınıf aralığını b. Sınıf sayısını (2 k > n  2 k > 38  k = 6 (64 > 38) ve sınıf aralığını (max-min/ k) bulunuz c. c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram frekans poligonunu d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz Selami ÖZCAN İstatistik 56

57 Soru 8: İktisat 2. sınıfların yaşları aşağıdaki gibidir.(n=26) Selami ÖZCAN İstatistik 57 a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını sınıf aralığını b. Sınıf sayısını ve sınıf aralığını (max-min/ istenen sınıf sayısı) bulunuz c. c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram frekans poligonunu d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz.

58 Selami ÖZCAN İstatistik 58 ÜÇÜNCÜ BÖLÜM MERKEZİ EĞİLİM (YER) MERKEZİ EĞİLİM (YER) ve ve DEĞİŞKENLİK ÖLÇÜLERİ DEĞİŞKENLİK ÖLÇÜLERİ

59 Selami ÖZCAN İstatistik BÖLÜM: Sunum planı 1. Merkezi eğilim ölçüleri Parametrik Merkezi eğilim ölçüleri (Duyarlı) 1. Aritmetik ortalama X 2. Geometrik ortalama G 3. Harmonik ortalama H 4. Kareli ortalama K Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız) 1. Mod 2. Medyan 3. Kantiller (kartiller, desiller, pörsentiller) 2. Dağılım / değişim ölçüleri Parametrik dağılım/değişim ölçüleri 1. Değişim aralığı (Ranj) 2. Kartil aralığı 3. Desil aralığı Parametrik olmayan dağılım/değişim ölçüleri – Ortalama sapma – Varyans – Standart sapma – Değişim katsayısı

60 Selami ÖZCAN İstatistik Merkezi Eğilim Ölçüleri bir veri kümesinin ortasını belirleme eğiliminde olan sayısal değerdir. Gözlem değerlerinin etrafında toplanma eğilimi gösterdiği değerdir. Duyarlı ortalamalar: Parametrik Merkezi eğilim ölçüleri (Duyarlı ortalamalar: serideki tüm gözlem değerlerinden etkilenen ortalamalardır. ) 1. Aritmetik ortalama X:Deneklerin aldıkları değerlerin toplanıp denek sayısına bölünmesiyle elde edilen değerdir 2. Geometrik ortalama G= 3. Harmonik ortalama H= 4. Kareli ortalama K= Duyarsız Ortalamalar Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar) 1. Medyan (ortanca):Bir ölçek üzerinde orta noktanın yerini gösteren bu ölçü tüm değerleri ortadan ikiye bölen değerdir 2. Mod:Ölçümlerde en fazla tekrar edilen değere mod denir 3. Kantiller (kartil desil pörsentil) 4. Ortalama kartil Parametrik merkezi eğilim ölçülerindeki ortalamaların değeri, serinin herhangi bir biriminin değeri değiştiğinde değişir. Yani değişikliklere duyarlı olan ortalamalar. Parametrik olmayan merkezi eğilim ölçülerindeki ortalamaların değerinin değişmesi için bu ortalamaların hesabında kullanılan birimlerin değerinin değişmesi gerekir.

61 Selami ÖZCAN İstatistik 61 Aritmetik Ortalama x Serideki bütün rakamlardan etkilenen ve en çok kullanılan ortalamadır.Özellikleri: Duyarlı bir ortalamadır, aşırı değerlerden etkilenir. Gözlem değerlerinin aritmetik ortalamadan sapmaların toplamı sıfırdır. (x-x)=0 Gözlem değerlerinin aritmetik ortalamadan sapmaların kareleri toplamı minimumdur.(x-x)²=min

62 Basit Serilerde Aritmetik Ortalama: x= Σx/n Puan toplamlarının veri sayısına bölümüdür. Örnek1 Örnek 2: X Top X=60/4= Top: 512 X=512/9=56,88

63 Selami ÖZCAN İstatistik 63 Frekans Serisinde Aritmetik Ortalama X f fx x=Σfx/Σf X=69/10=6, Σf=10 Σfx=69

64 Gruplandırılmış Seride Aritmetik Ortalama Selami ÖZCAN İstatistik 64 Gruplar Frekans Ort değ.(x) fx [(2+4)/4] Σf=20 Σfx=132 X=132/20=6,6

65

66 Selami ÖZCAN İstatistik 66 Tartılı Aritmetik Ortalama bir serideki değerler arasında önem derecesi farklı oluyorsa bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için önem düzeyini gösteren katsayılar (tartılar) kullanılır. Örnek: aşağıda öğrencinin almış olduğu dersler ve kredileri verilmiştir. Tartılı ortalamasını hesaplayınız. Dersler Not(X) Kredi(t) t X Üretim Yönetimi İstatistik İktisat Matematik Pazarlama Toplam Σt=15 Σtx=1162 tX=1162/15=77,47 Basit seride: Xt= Σtx/Σt frekans serisinde: Xt= Σtfx / Σtf Gruplandırılmış seride: Xt= Σtfm/Σtf

67 Selami ÖZCAN İstatistik 67 Geometrik ortalama (G) Serideki n tane birimin çarpımının n inci dereceden kökü alınarak hesaplanır. G= n √ x 1.x 2.x 3 …..x n (basit) logG=1/n(logx 1 +logx 2 +.logx n ) G= Σf √ X 1 f1. X 2 f2. … X n fn (frekans ve grup ) Log G=1/ Σf. [f 1 logX 1 + f 2 logX 2 + ….+log X n ] Örnek Örnek (basit) X=10,12,18,20 G=4√10x12x18x20=4√43200≈14.42 LogG=1/4 (log10+log12+log18+log20) LogG=1/4( =4.6355) G Log G=1/4 (ΣlogX)=4,6355/4= x10 G= (Açıklama: Log G yi G ye çevirmek için logG yi 10 ile çarparız. Yani G=10 log G) Örnek (frekans) X=4,5,7,9 f=1, 2, 4, 3=10 Log X=0.6021, , , f. logX=(1x0.6021)+(2x0.6990)+(4x0.8451)+(3x0.9542) = LogG=1/ Σf.(fxlogX)= /10=0,8243 Log G=1/10. ( )= Log G= (1/Σf ). (fxLog X)=8.2431/10= G=10 x = Örnek (grup)2-4, 5-7, 8-10, Sadece grupların orta noktası bulunarak yapılır.

68 Selami ÖZCAN İstatistik 68 HARMONİK ORTALAMA (H) Serideki birimlerin çarpmaya göre terslerinin aritmetik ortalamaya göre tersleridir. Seride 0 veya negatif bulunması durumunda H hesaplanamaz H=n/Σ(1/x) basit seri için H= Σf/ Σ(f/x) frekans ve gruplandırılmış seri için Örnek Örnek : x=10, 12, 18, 20 basit seride harmonik ortalamayı bulunuz? 1/X=1/10+1/12+1/18+1/20= 0,1000+0,0833+0,0556+0,0500=0, ,85 H=n/Σ(1/x) =4/0,2889= 13,85 Örnek: Örnek: frekans serisinin harmonik ortalamasını bulunuz? X=4, 5, 7, 9 f=1, 2, 4, 3=10 H= Σf/ Σ(f/x)=10/(1/4+2/5+4/7+3/9)= H=10/( ,4000+0,5714+0,3333)=10/1,5547=6,43 Örnek Örnek: gruplandırılmış serinin harmonik ortalaması nedir? X=2-4, 5-7, 8-10, f=2, 13, 4, 1=20 önce ortalamalar bulunur. X= 3, 6, 9, 12 sonra f/x ler yani 2/3,13/6,4/9,1/12 H= Σf/ Σ(f/x)=20/(0,6667+2,1667+0,4444+0,0833)=5,95

69 Selami ÖZCAN İstatistik 69 KARELİ ORTALAMA (K) Seriyi oluşturan gözlem değerlerinin karelerinin toplamının gözlem sayısına oranının kare köküdür. K= √ ∑X²/n basit seriler için K= √ ∑fX² / ∑f frekans ve grup serileri için Örnek Örnek : x=10, 12, 18, 20 basit serinin kareli ortalamasını bulunuz? X²= =968 K= √ ∑X²/n= √ 968/4=15.56 Örnek Örnek: X=4, 5, 7, 9 f=1, 2, 4, 3=10 frekans serisinin kareli ortalamasını hesaplayınız? K= √ ∑fX² / ∑f frekans serisi ve gruplandırılmış seri için X²= = f X²=1x16+2x25+4x49+3x81=505 K= √ ∑fX² / ∑f= √ 505/10=7.11Örnek: Grup=2-4, 5-7, 8-10, f=2, 13, 4, 1=20 gruplandırılmış serinin kareli ortalamasını bulunuz? Önce orta nokta bulunur. X= 3, 6, 9, 12 sonra X² = 9, 36, 81, 144 f=2, 13, 4, 1=20 fx ² =2x9+13x36+81x4+144x1=954 K= √ ∑fX² / ∑f= √ 954/20=6.91

70 Selami ÖZCAN İstatistik 70 Duyarsız Ortalamalar Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar) Duyarlı olmayan ortalamalar: seriyi oluşturan tüm gözlem değerlerinin büyüklüklerinden etkilenmeyen ortalamalardır. Medyan Mod Kantiller – Kartiller – Desiller – Pörsentiller

71 Selami ÖZCAN İstatistik 71 MEDYAN (Orta Değer, Ortanca) basit ve frekans (N+1)/2 (N+1)/2 N/2 Büyükten küçüğe, küçükten büyüğe doğru sıraladığımızda tam ortaya düşen değer (iki değerin ortalaması) seriyi iki eşit parçaya bölen gözlem değeridir. N=toplam frekans, basit ve frekans serilerinde (N+1)/2 medyandır. Gruplandırılmış seride kaçıncı değerin medyan olduğunu bulmak için “.. den az kümülatif frekanslar bulunur. (N+1)/2 değerinin içerisinde yeraldığı kümülatif frekans gruplandırılmış seride medyan sınıfını ifade eder. Frekans ve gruplandırılmış serilerde çok sayıda değer olacağı için 1 dikkate alınmayabilir. Yani N/2 olur. N/2=medyanı gösteren değer L=medyan sınıfının alt sınırı N=toplam frekans (∑f) f m-1 =medyan sınıfına kadar sınıfların frekansları toplamı f m =medyan sınıfının frekansı h m =medyan sınıfının büyüklüğü Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir.

72 Basit seride medyana örnek Basit seri Basit seri: – tek sayı ise: ham veri: 2,2,3,7,4,5,6 4 basit seri: 2,2,3,4,5,6,7 (4 medyan) – çift: 10, 12, 8, 4, 9, 3 8,5 sırala 3, 4, 8, 9, 10, 12 (8+9)2=8,5 medyan Örnek (çift) 15 X N=(4+1)/2=2,5 yani 2. ve 3. değerlerin ortalaması 12+18/2=15 medyan Selami ÖZCAN İstatistik 72

73 Frekans serisinde Medyana Örnek Selami ÖZCAN İstatistik 73 Örnek 1: tek Örnek 1: tek ise: x=2,4,6,8, f=2,4,3,5,1=15 15/2= 7.5 frekansa karşılık gelen X değeri medyandır. 9 küm.f=2, 6, 9,14, 15= 7,5 değeri 6’dan büyük olduğu için frekansı 9 olan x değeri 6 medyandır. Örnek 3: çift Örnek 3: çift ise X=4,5,7,9 f=1,2,4,3 küm.f=1,3,7,10 N+1/2 yani 10+1/2=5,5 değer medyandır. 5,5 değer 5 ten büyük olduğu için bir sonraki değer olan 7 nin içinde yer alır. Küm.frekansı 7 olan 7 değeri medyandır. Örnek 3:

74 Selami ÖZCAN İstatistik 74 Gruplandırılmış seride medyan formülü ve notasyonları Formuldeki notasyonlar N/2=medyanı gösteren değer L=medyan sınıfının alt sınırı N=toplam frekans (∑f) fm-1=medyan sınıfına kadar sınıfların frekansları toplamı fm=medyan sınıfının frekansı hm=medyan sınıfının büyüklüğü Çok sayıda değer olacağı için sınıflama/gruplama yüzünden yaklaşık medyan değeri bulunur.

75 Örnek 1: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz? X f küm.f...den az küm.f..den çok küm.f =20 20/2=10 Çözüm 1: 10. Değer 15 frekansın içindedir. 5-7 Küm frekans= sınıfı göstermektedir. 3 Alt sınır:4,5 Üst sınır:7,5 büyüklüğü 3 tür. Medyan sınıfının bir önceki küm.frekansı 2, Medyan sınıfının frekansı:13 tür. Medyan:4,5+[(10-2)/13 ]x3=6, Selami ÖZCAN İstatistik 75 Çözüm 2: Grafik metodu: ”..den az ve..den çok” değerleri aynı grafikte gösterilirse x eksenindeki kesişim noktası medyandır ,35 Gruplar Küm.Frekans

76 Örnek 2: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz? X f küm.frekans =22 22/2=11..den az serisinin 11. gözlem değeri sınıfı medyan sınıfıdır. L=18, N/2=11 fm-1=7 fm=8 hm:4 20 Medyan: 18+ [(11-7)/8] x 4=20 medyan sınıfının içinde yer alıyor Selami ÖZCAN İstatistik 76

77 Örnek3: Aşağıdaki dağılımın ortalama ve medyan değerini hesaplayın.

78 Örnek 4: işletme 2. sınıf öğrencilerinin yaşlarının oluşturduğu sınıf ve frekansları aşağıdaki gibidir. Dağılımın ortalama ve medyan değerini bulunuz? Selami ÖZCAN İstatistik 78

79 Diğer örnekler (35+1/2= nin içinde grup medyan sınıfı) 54.5+{[(35/2)-14] /6}x3=56,25 medyan Selami ÖZCAN İstatistik 79

80 Selami ÖZCAN İstatistik 80 Sınıflandırılmış/Gruplandırılmış serinin grafikle gösterimi Gruplar k.f. Grafik Metodu ile Medyan “..den az kümülatif frekans eğrisinin kesiştiği noktasındaki X değeridir. Medyan değeri: 6.15

81 Mod (Tepe Değer) Mod ya da tepe değer, bir seride (puan dağılımında) en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Bir sayı setinde elemanların hepsi birbirinden farklı ise bu basit serinin modu yoktur. Basit Basit seriye Örnek1: 60,72,82,72,61,81,72 ise Mod=72’dir. Örnek 2: x=1,1,2,1,3,2,2,1,1,3,5,4,1,1,2 en çok tekrar edilen 1 modtur. Örnek 3: 5, 7, 12, 28, 40, 35 mod yoktur Örnek 4:10,12,18,20 mod yoktur. Frekans Frekans seriye Örnek 1: X=2,3,4,5 f=2,4,7,1 en büyük frekans 7, mod değeri ise 4 Örnek 2: x=4,5,7,9 f=1,2,4,3 frekansı (4) en yüksek x değeri 7 modtur. Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. Tepe Değer (Mod) ile ilgili bazı önemli noktalar 1)Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur. 4 2)Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur.Dizinin modu 4 3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu bulunmaktadır.

82 Sınıf/Gruplandırılmış Serinin Modu Örnek Selami ÖZCAN İstatistik 82 L = mod sınıfının alt sınırı ∆ 1 = mod sınıfı frekansı ile ondan bir önceki sınıfın frekansları arasındaki mutlak fark ∆ 2 = mod sınıfının frekansı ile ondan bir sonraki sınıfın frekansları arasındaki fark h m = sınıf aralığı, mod sınıfının sınıf büyüklüğü Örnek 1 Örnek 1: Gruplar=2-4, 5-7, 8-10, frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 Mod: 4,5+11/(11+9) x 3= 6,15 Örnek 2: Mod:en büyük frekans bir gözlem değerine değil, bir sınıfa karşılık gelmektedir. Bu sınıfa mod sınıfı denir

83 Selami ÖZCAN İstatistik 83 Örnek 1’in Grafik Metodu ile Çözümü Gruplar=2-4, 5-7, 8-10, frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 Mod: 4,5+11/(11+9) x 3= 6,15 Mod:6,15 1,5 4,5 7,5 10,5 13,5 Gruplar Frekans

84 Örnek 3 ve 4 Örnek 3: Sınıflar Frekans Küm.frekans Toplam 21 L=18, ∆1= 7-4=3, ∆2= 7-5=2 hm=4 Mod değerinin mod sınıfı içinde kaldığına dikkat ediniz. Birden fazla aynı değerde frekans varsa iki yada daha çok gözlem değeri veya sınıf bulunabilir. İlgili frekans serisi sınıflandırılarak, sınıflandırılmış seri ise farklı bir sınıf aralığında yeniden sınıflandırılmalıdır. Yeniden sınıflandırılır. Örnek 4: frekans Yeniden sınıflandırılır Toplam Toplam Mod:30+(29/(29+3)) x 20=48, Toplam Selami ÖZCAN İstatistik 84

85 Selami ÖZCAN İstatistik 85 Ortalamalar arasındaki ilişki SimetrikSağa eğikSola eğik X Mod Medyan Mod Medyan XX Mod Medyan X > Medyan > ModMod > Medyan > X Mod=Medyan= X

86

87 Dağılımda Çarpıklık: Negatif Çarpık Dağılım Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama

88 Dağılımda Çarpıklık: Pozitif Çarpık Dağılım Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod

89

90 Selami ÖZCAN İstatistik 90 KANTİLLER KANTİLLER KARTİLLER, DESİLLER, PÖRSENTİLLER Kartiller4 1. Kartiller: büyüklük sırasına konulmuş bir seriyi 4 eşit parçaya böler.Bir seride 3 kartil bulunur. 2. kartil medyandır. Q 1, Q 2, Q 3 ile gösterilir. Basit frekans Basit ve frekans serisinde kartil: Q 3 =3x(N+1)/4 Q 1 =N+1/4 Q 2 =2x(N+1)/4 Sınıf/gruplandırılmış Sınıf/gruplandırılmış serilerde kartil: Q 1 =L+[(N/4)-∑f/f Q1 ] x h m Q 2 =L+[(2.N/4)-∑f/f Q2 ] x h m Q 3 =L+[(3.N/4)-∑f/f Q3 ] x h m Desiller 2. Desiller =D 9, D 1 dir. (seriyi 10 eşit parçaya böler) Basit ve frekans serisinde desiller: D 3 =3x(N+1)/10 D 1 =N+1/10 D 2 =2x(N+1)/10 Grup serilerde desiller: D 1 =L+[(N/10)-∑f/f D1 x h m D 2 =L+[(2.N/10)-∑f/f D2 x h m D 3 =L+[(3.N/10)-∑f/f D3 x h m Pörsentiller 3. Pörsentiller =D99-D1 dir. (seriyi 100 eşit parçaya böler) Basit ve frekans seride Pörsentiller: P 3 =3x(N+1)/100 P 1 =N+1/100 P 2 =2x(N+1)/100 Grup serilerde pörsentiller: D 1 =L+[(N/100)-∑f/f P1 x h m P 2 =L+[(2.N/10)-∑f/f P2 x h m P 3 =L+[(3.N/100)-∑f/f P3 ] x h m

91 Selami ÖZCAN İstatistik Dağılım/Değişkenlik Ölçüleri Dağılım / değişim ölçüleri Parametrik dağılım/değişim ölçüleri 1. Değişim aralığı (Ranj) 2. Kartil aralığı 3. Desil aralığı Parametrik olmayan dağılım/değişim ölçüleri – Ortalama sapma – Varyans – Standart sapma – Değişim katsayısı

92 Selami ÖZCAN İstatistik 92 Parametrik olmayan dağılım/değişim ölçüleri 1. Değişim aralığı (Ranj) 2. Kartil aralığı, yarı kartil aralığı 3. Desil aralığı, yarı desil aralığı

93 Selami ÖZCAN İstatistik 93 Değişim Aralığı (Ranj):DA En büyük ölçümle en küçük ölçüm arasındaki farktır. gruplandırılmış serilerde en yüksek sayıdan en küçük sayının çıkarılması ile bulunur. DA serinin değişkenliği hakkında zaman kaybetmeden genel bilgi verir. Dezavantajı:serideki bütün birimlerin hesaplamaya girmemesi sadece iki değerle hesaplamanın yapılması, aşırı değerlerin direkt etkisindedir. DA= Xmax-Xmin Örnek: basit seri: X=30,32,35,36,37 y=2,14,20,44,90 DA(x)=37-30=7 DA (y)=90-2=88 Örnek: Frekans serisi x:4,5,7,9 f:1,2,4,3 DA=9-4:5 Örnek: sınıflandırılmış seri: sınırlar:1-3,3-5,5-7,7-9 f=1,2,4,3 DA:9-1:8

94 Ranj (Değişim Aralığı) Örnek Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=? Ranj (DA)= 61-59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? Ranj (DA)= 90-30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar.

95 Selami ÖZCAN İstatistik 95 Kartil (çeyrek sapma) Aralığı Desil (onda bir sapma) Aralığı Pörsentil (yüzde 1 sapma)Aralığı Kartil aralığı 3. kartilden 1. kartil çıkarılarak bulunur. En büyük ve en küçük %25 dikkate alınmadığı için Değişim Aralığına göre uç değerlerden daha az etkilenir. Dezavantajı hesaplamaya bütün değerlerin katılmaması Kartil Aralığı= Q 3 -Q 1 dir. Yarı Kartil Aralığı=(Q 3 -Q 1 )/2 (seriyi 4 eşit parçaya böler) Desil Aralığı=D 9 -D 1 dir. Yarı Desil Aralığı=(D 9 -D 1 )/2 (seriyi 10 eşit parçaya böler) Pörsentil Aralığı=D 99 -D 1 dir. Yarı Pörsentil Aralığı=(D 99 -D 1 )/2 (seriyi 100 eşit parçaya böler)

96 Kartil: Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur.

97 Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: ,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80, yüzdelik için (Y 25 )= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y 75 )= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma  (65-25)/2=20 olur.

98 Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir.

99 Örnek: Çeyrek Sapma Puan AralığıfToplamalı Frekans Aralığın Gerçek Sınırı 21,00-25,001120,50-25,50 26,00-30,001225,50-30,50 31,00-35,002430,50-35,50 36,00-40, ,50-40,50 41,00-45, ,50-45,50 46,00-50, ,50-50,50 51,00-55, ,50-55,50

100

101

102 Selami ÖZCAN İstatistik 102 Parametrik dağılım/değişim ölçüleri Paremetrik olmayan dağılım ölçüleri serideki bütün değişkenleri dikkate alarak ölçmesi, fakat paremetrik dağılım ölçülerinde ise serideki rakamların aritmetik ortalamadan sapmalarını dikkate alır. – Ortalama sapma – Varyans – Standart sapma – Değişim katsayısı

103 Selami ÖZCAN İstatistik 103 Ortalama Sapma Serideki rakamların aritmetik ortalamadan farklarının toplamı sıfırdır. Ortalamadan farkların bir kısmı negatif bir kısmı pozitiftir. Toplarsan sıfır olur. Hesaplama mutlak değerlerin toplamı rakam sayısına bölündüğünde os bulunur. Formül yandaki gibidir. Medyan etrafındaki ortalama sapmanın minimum olmasıdır. Basit seride Frekans serisinde Sınıflandırılmış/gruplandırılmış seride

104 Selami ÖZCAN İstatistik 104 Varyans Aritmetik ortalamanın özeliklerinden biri ∑(x- x)²=minimum olmasıdır. Fark karelerin toplamını serideki rakam sayısına böldüğümüzde varyans elde edilir. Örnek sayısı büyüdükçe n ile n-1 arasında fark kalmaz.

105 Selami ÖZCAN İstatistik 105 Standart Sapma Standart Sapma: Ölçümlerin ortalamadan olan farklarının karelerinin ortalamasının kareköküdür. Standart sapma varyansın pozitif kareköküdür. Standart hata: Aritmetik ortalamada oluşan hatanın belirlenmesi için bulunur. Örnek1basit seri Örnek1: basit seri x=1,4,5,7,9,10 x=36/6=6 (x-x)=1-6,4-6,5-6,7-6,9-6,10-6 = -5,-2,-1,1,3,4= (x-x)²=25,4,1,1,9,16=56 Örnek2: 78,89,56,36,48,92,59,60=S=19.8

106 Selami ÖZCAN İstatistik 106 Frekans Serilerde Standart Sapma Xfx.fx-x(x-x)²(x-x)². f 414-3,2510, ,251,56254, ,250,06250, ,750,56252, ,757,562515, Frekans serisinin ortalaması X=∑x.f / ∑f=116/16=7,25 Frekans serisinin standart sapması

107 Selami ÖZCAN İstatistik 107 Gruplandırılmış seri(orta noktalar bulunur veya (kodlama metodu) Gruplarfu=kodf. uu²u² Toplam

108 Standart sapma Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır.  ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir.  SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir.

109 Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır:

110

111

112 Standart Sapmanın Özellikleri SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. Negatif değerler almaz. Veri grubundaki tüm değerler aynı ise SS sıfırdır. SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir

113 Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki Aritmetik ortalama ile standart sapmanın arası büyürse, Heterojen yapı oluşur ve grup başarısı düşer. Aritmetik ortalama ile standart sapmanın arası küçülürse, Homojen yapı oluşur ve grup başarısı artar. Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe, Standart sapmada büyür. Bir testten elde edilen puanların standart sapması büyüdükçe, Testin güvenirliği artar.

114 Standart Hata Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. 114

115 Selami ÖZCAN İstatistik 115 Değişim Katsayısı: DK Aynı seri farklı ölçü birimleriyle farklı standart sapmaya sahip olabilir, farklı ölçü birimleriyle hesaplanan iki ayrı serinin mukayesesi de doğru değildir. Bu olumsuzlukları gidermek için değişim katsayısı geliştirilmiştir. Mutlak değişkenlik ölçüleri,seriyi oluşturan gözlem değerlerinin büyüklüklerinin de etkisi altındadır. Mutlak değişkenlik yerine nispi değişim/dağılım esas alınmıştır. Standart sapma aritmetik ortalamanın yüzdesi olarak ifade edilmiştir. DK=(s/ X) x 100 Ortalaması 15, standart sapması 4,76 olan serinin DK ne olur? DK:(4,76/15) x 100=%31,73 x=10,11,13,14,17/65 (x=13, ss=2,7386) y=43,48,58,63,73/285 (y=57 ss=11,9373) ssx küçük ssy. DKx=2,7386/13 x 100=%21,066 DKy=11,9373/57 x100=%20,9426 X serisindeki değişkenlik y serisine göre daha fazladır.

116 BÖLÜNMENİN ŞEKLİNE GÖRE OLUŞAN ÖLÇÜLER Şu ana kadar serilerdeki ortalama ve değişkenliği inceledik, bu yetmez. Bölünme şeklini ortaya koyan ölçülere de ihtiyaç vardır. sağasola Seriler: simetrik (X=Med=Mod) veya asimetrik (X>Med>Mod sağa çarpık seri ve X

117 Bölünme şekline göre oluşan ölçüler, – Momentler, – Çarpıklık ve – Basıklık Selami ÖZCAN İstatistik 117

118 MOMENTLER Ortalamalara (kantillere) dayanan asimetri ölçüsü yaklaşık bir değerdir. Asimetriyi daha duyarlı ölçmek için momente dayanan ölçüm yapılması gerekir. Sıfıra (x-0=x i ) veya aritmetik ortalamaya (x-x ort ) göre sapmaların tamamına moment denir. Bir seride sıfır (aritmetik ortalama) etrafındaki r. Momente (µ r.) Momenti denir. M r =£X ʽ /n (0 için basit serinin momenti) M r =£(X-X ort ) ʽ /n (X ort için basit serinin momenti) µ r =£fx ʽ /£f (0 için frekans ve gruplandırılmış serinin momenti) µ r = £f(x-x ort ) ʽ /£f (X ort için frekans ve gruplandırılmış serinin momenti) Sıfır etrafındaki 1.Moment aritmetik ortalamaya eşit, 2.momentin karekökü kareli ortalamaya eşittir. M1=0, M2=S²(varyans) µ 2 =M 2 -M² 1 µ 3 = M 3 -3M 1 M 2 +2M³ 1 µ 4 = M 4 -4M 1 M 3 +6M² 1 M 2 -3M ‘ 1 Örnek Örnek: x=10,12,18,20 serinin(0 ve x ort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm Çözüm: X=10, 12, 18, 20 =60/4=15 X²=100,144,324,400=968 M2=968/4=242 X3=1000,1728,5832,8000=16560 M3=16560/4=4140 X-X ort =10-15,12-15,18-15,20-15=-5,- 3,3,5 (X-X ort )²=25, 9, 9, 25=68 M2=68/4=17 (X-X ort )3=-125, -27, 27, 125=0 M3=0/4=0 µ 2 =M 2 -M² 1 =242-15²=17 µ 3 = M 3 -3M 1 M 2 +2M³ 1 = (15).(242)+2.(15)³=0 µ 4 = M 4 -4M 1 M 3 +6M² 1 M 2 -3M ‘ 1

119 Gruplandırılmış Serinin Moment hesabı Örnek Örnek: Gruplar=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3=10 serinin (0 ve xort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm Çözüm: önce sınıf orta noktaları bulunur. X=2, 4, 6, ,8 f=1, 2, 4, 3 =10 X ort =58/10=5,8 X²=4,16,36,64= X³=8,64,216, f.X=2,8,24,24=58 f.X²=4,32,144,192=372 f.X³=8,128,864,1536=2536 (X-X ort )=(2-5,8)=-3,8 (4-5,8)=-1,8 (6-5,8)=0,2 (8- 5,8)=2,2 (X-X ort )²=14,44 3,24 0,04 4,84 (X-X ort )³= -54,872 -5,832 0,008 10,648 f.(X-X ort )²=14,44 6,48 0,16 14,52 =35,60 f.(X-X ort )³=-54, ,664 0,032 31,944 = - 34,560 µ 2 =M 2 -M² 1 =37,2-(5,8)²=3,56 µ 3 = M 3 -3M 1 M 2 +2M³ 1 =253,6-3(5,8).(37,2)+2.(5,8)³=-3,456

120 ÇARPIKLIK (Asimetri) Bir serinin simetriden ayrılmasıdır. Rakamların dağılımı her zaman simetrik olmaz. Dağılım sağa ve sola çarpık olabilir. Serideki asimetriyi çarpıklık katsayısı ile ölçeriz. Çarpıklık katsayısı 0’a eşit olduğunda dağılım simetriktir. Çarpıklık katsayısı negatif olduğunda sola çarpık, pozitif olduğunda sağa çarpık olur. Çarpıklık katsayıları 3 e ayrılır. Pearson Çarpıklık Katsayısı Kartil Çarpklık Katsayısı Moment Çarpıklık Katsayısı

121 Pearson Çarpıklık Katsayısı Pearson ortalamalar arasındaki şu ilişkiyi fark etmiştir. X ort -Mod≈3(X ort - Medyan) standart sapmaya Her iki tarafı standart sapmaya bölerek bu ifadeleri ölçü biriminden bağımsız hale getirmiştir. Çarpıklık=3(X ort -Medyan) / standart sapma Çarpıklık=(X ort -Mod) / standart sapma Not: bu katsayı sıfıra eşit ise dağılım simetrik, büyükse sağa çarpık, küçükse sola çarpıktır. X=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3 kf=1, 3, 7, 10 Medyana dayalı çarpıklık için aritmetik ortalama ve standart sapmayı bilmek gerekir. Aritmetik ortalama:5,8 2.Moment ise 3,56 (varyanstır) Standart sapma=√3,56≈1,89 N=10 10/2=5. değer medyandır. Medyan 5-7 sınıfı Yaklaşık medyan değeri=5+[(5-3)/4].2=6 dır. Medyana dayalı çarpıklık= 3(x ort -medyan)/standart sapma Medyana dayalı çarpıklık= 3(5,8-6)/1,89 ≈-0,32 Mod=L1+[∆1/ (∆1+ ∆2)].c =5+[2/(2+1)]2=6,33 Moda dayalı çarpıklık= =(X ort -Mod) / standart sapma= -0,28 Moda dayalı çarpıklık 5,8-6,33 / 1,89= -0,28 Seri sola çarpıktır.

122 Kartil Çarpıklık Katsayısı Herhangi bir dağılıma ait kartil değerleriyle de asimetrik dağılım olup olmadığına karar verilebilir. K ç =(K 3 -K 2 )-(K 2 -K 1 ) / K 3 -K 1 K ç =(K 3 -2K 2 )+K 1 / K 3 -K 1 Örnek: (pearsen örneğinin devamı) medyan 6, medyan 2. kartile eşittir.1. ve 3. kartili tespit etmek gerekir. Sonra çarpıklığa bakılır. K1 için N/4 10/4=2,5 değer 1.kartildir. Kümülatif frekansı 3 olan 3-5 sınıfı 1.kartil sınıfıdır. K3 için 3N/4=3x10/4=7,5 değerdir. Sınıfı 7-9 sınıfıdır. K 1 =3+ [(2,5-1)/2].2=4,5 K 3 =7+[(7,5-7)/3].2=7,33 Buna göre Kartil çarpıklık katsayısı şu şekilde bulunur. K ç =(K 3 -2K 2 )+K 1 / K 3 -K 1 K ç =(7,33-2x6+4,5) / (7,33-4,5) =- 0,06 Negatif çıktığı için seri sola çarpık demektir.

123 Moment Çarpıklık Katsayısı Ortalama etrafındaki 3. momentin standart sapmanın 3. kuvvetine bölünmesiyle elde edilir. α 3 =µ 3 /s³ Simetrik dağılımlarda moment çarpıklık katsayısı 0 dır. α 3 >0 ise sağa çarpık, α 3 <0 ise sola çarpıktır. Örnek1: 2.moment 17 ve 3. moment 0 dır. Aritmetik ortalama etrafındaki 2. moment, varyans ve bunun karekökü de standart sapmaya eşittir. Standart sapma=4,12 Bu dağılıma ait moment çarpıklık katsayısı=0/(4,12)³=0 Sonuç, katsayı 0 olduğu için dağılım simetriktir. Örnek 2= aritmetik ortalama etrafındaki 2. moment 3,56 (varyans)(standart sapma varyansın karekökü yani 1,89) ve 3.moment -3,456 ise moment çarpıklık katsayısı nedir? α 3 =µ 3 /s³=-3,456/(1,89)³=-0,51 (sola çarpıktır.)

124 BASIKLIK (momente dayanan basıklık ölçüsü) Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir. ά 4 =3 olursa yükseklik normal ά 4 ≥ 3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά 4 ≤ 3 dağılım basıktır(dağılımda değişkenlik fazla). S4=(µ 2 )² moment basıklık katsayısını Ör: bir önceki örnekte aritmetik ortalama etrafındaki 2. moment µ 2 =17 ve µ 2 =3,56 olarak hesaplanmıştı önce aritmetik ortalama etrafındaki 4. momenti bulunuz. Sonra moment basıklık katsayısını bulunuz. Örnek1 Örnek1: X=10,12,18,20 =60/4=15 (basit) Çözüm Çözüm: (X-X ort )=-5, -3, 3, 5 (X-X ort )4=625, 81, 81, 625=1412 ά 4 = µ 4 /S 4 =>µ 4 =1412/4=353 S4=(17)²=144 ά 4 =353/144=1,22 < 3 ten küçük olduğu için dağılım normale göre basıktır. Örnek2 Örnek2: X=2,4,6,8 f=1,2,4,3 =10 (frekans)Çözüm: (X-Xort)= -3,8 -1,8 0,2 2,2 (X-Xort)4=208, ,4976 0, ,4256 f. (X-Xort)4=208, ,9952 0, ,2768 =299,7920 µ 4 =299,792/10=29,9792 S4=(3,56)²=12,6736 ά 4 =29,9792/12,6736=2,37 < 3 olduğundan seri normale göre basıktır. Yani dağılımın değişkenliği normal dağılımın değişkenliğine göre fazladır.

125 Selami ÖZCAN İstatistik 125 BASIKLIK Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir.ά 4 =3 olursa yükseklik normal ά 4 ≥ 3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά 4 ≤ 3 dağılım basıktır(dağılımda değişkenlik fazla). Ör:

126 Çarpıklık Katsayısı Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir.

127 Dağılımın Basıklığı

128 Selami ÖZCAN İstatistik 128 DÖRDÜNCÜ BÖLÜM İHTİMAL HESABI

129 Selami ÖZCAN İstatistik BÖLÜM: Sunum planı Deney, sonuç ve örneklem uzay Olasılık (ihtimal) Olasılık(ihtimal) Hesaplama Sayma ve Ayrılık olayları Çarpma Kuralı Toplama Kuralı Beklenen değer (matematik ümit) Bazı kurallar

130 Selami ÖZCAN İstatistik 130 GİRİŞ Meteroroloji uzmanı: %80 ihtimalle yağmur yağacağını Sağlık uzmanı sigara içenlerin içmeyenlere oranla daha çabuk kansere yakalanacağını İhtimal tahlil edici, çıkarımsal istatistiktir. Satış tahminleri

131 Selami ÖZCAN İstatistik 131 DENEY, SONUÇ VE ÖRENLEM UZAY DeneySonuçÖrneklem uzay Vida incelemeHatalı / hatasızS=(hatalı, hatasız) Paranın bir kez atılmasıYazı turaS=(yazı, tura) Paranın iki kez atılmasıYY,YT,TT, TYS=(YY,YT,TT,TY) Zarın bir kez atılması1,2,3,4,5,6S=(1,2,3,4,5,6) Doğacak bebeğin cinsiyetiErkek, kızS=(kız, erkek) Öğrencinin yarıyıl sonuçuBaşarılı, başarısızS=(başarılı, başarısız) Deney: pek çok gözlemden sadece bir tanesinin gerçekleşmesi sürecine deney denir. Deneyin sonuçları: bu gözlemlere deneyin sonuçları denir. Örneklem uzay Örneklem uzay: bu sonuçların tümüne ise deneyin örneklem uzayı denir. Örneklem uzay S ile gösterilir. s= (hatalı, hatasız) Örneklem noktaları Örneklem noktaları: örneklem uzayın elemanlarına örneklem noktaları denir.

132 Selami ÖZCAN İstatistik 132 Örneklem Uzay/ örnek uzayı s=(Y,T) Venn Şeması: bir deneyin tüm muhtemel sonuçlarının kare, dikdörtgen veya daire ile gösterilmesine denir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) venn şeması ile gösterilmesi Ağaç diyagramı: her bir sonucun ağacın bir dalı ile ifade edilmesidir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) ağaç diyagramı ile gösterilmesi Y. T. Yazı Tura Y T Nihai Sonuçlar

133 Selami ÖZCAN İstatistik 133 BASİT VE BİLEŞİK OLAY Olay Olay: bir deneyin bir veya daha çok sonucundan oluşur. Olay basit (elementer) ve bileşik (katışık) olay şeklinde gerçekleşmektedir. Basit olay Basit olay: herhangi bir deneyin nihai sonuçlarına denir. Basit olay sadece ve sadece bir tane sonuç içermekte Ei biçiminde gösterilir. Örnek her biri Örnek: bir işyerinde çalışan personel arasında rastgele iki tanesinin seçildiği ve cinsiyetlerinin(erkek, kadın) kaydedildiği düşünülsün bu deneyin tüm sonuçları: E1(EE), E2(KE), E3(EK), E4(KK) bu dört durumdan her biri basit olaydır. Yarın yağmur yağması ihtimali, tek sonuç Sınıfta gözlüklü öğrenci olması ihtimali tek sonuç Bileşik (katışık) olay Bileşik (katışık) olay: iki veya daha fazla sonucun yani birden çok sonuçtan oluşmaktadır. A1, A2, A3,… veya B1, B2, B3, B4, B5,….Bn şeklinde gösterilir. Birarada meydana gelen,birbirini engelleyen olaylr Örnek1 iki Örnek1: bir işyerinde çalışan personel arasında rastgele iki tanesinin seçildiği ve cinsiyetlerinin(erkek, kadın) kaydedildiği düşünülsün bu A olayının en çok bir erkeğin seçilmiş olduğunu venn şemasında gösteriniz? Bileşik olay: iki durum: istenen en çok bir erkek olması: EK, KE, KK, ikinci durum istenmeyen: EE Örnek2 iki En çok bir kişinin inanmıyor Örnek2: bir grup insan kainatın yaratıcısına inanıyor ve yaratıcıyı kabul ediyor, geri kalanı inanmamakta ve karşı çıkmaktadır. Bu gruptan rastgele iki kişi seçilmiş ve kainatın yaratıcısı hakkında görüşleri sorulmuş. Kaç farklı sonuç söz konusudur. En çok bir kişinin inanmıyor olma durumu nedir. İ:inanıyor, K:karşı çıkıyor/inanmıyor İİ: her ikisi de inanıyor. KK: her ikisi de inanmıyor. İK: biri inanıyor, biri inanmıyor.Kİ:biri inanmıyor, biri inanıyor. 4 farklı durum söz konusudur, birden çok sonuç var. Bileşik olaydır. İİ, İK, Kİ üç durum söz konusudur.

134 Selami ÖZCAN İstatistik 134 Basit ve bileşik olay örneklerinin Venn şeması ve Ağaç diyagramı gösterimi EE. A EK. KE. KK. İİ. İK. Kİ. KK. İ K K K İ İ İİ İK Kİ KK A∩B AUB BA

135 Selami ÖZCAN İstatistik 135 İhtimal Hesaplama İhtimal/Olasılık (Probability): bir olayın meydana gelme sansının sayısal ölçüsüdür. N birim ihtiva eden ana kütleden belli bir x özelliğini taşıyan n tane birim varsa bu ana kütleden rastgele bir birim alındığında bu birimin x özelliğini taşıması durumudur. P(x)=n/N şeklinde hesaplanır. Ei ile basit olayın ihtimali (P(Ei)dir. A ile bileşik olayı ihtimalı P(A) ile gösterilir. İhtimal (Olasılık) İki Temel Özelliği 1. Bir olayı meydana gelmesi ihtimali 0 ile 1 arasında değişir. Olay ister basit, ister bileşik olsun ihtimali sıfırdan küçük birden büyük olamaz. 0 ≤P(Ei) ≤1 0 ≤P(A) ≤1 P(x)=n/N=0 ise söz konusu olayın meydana gelmesi (imkansız=olanaksız) mümkün değildir. 1 olması olayın kesinlikle (yani %100) (mümkün=kesin) meydana geleceğini ifade eder.P(İ)=0 imkansız P(M)=1 mümkün olay içindir. Sıfıra yakın ihtimal zayıf bire yakın ihtimal kuvvetli 2. Bir olayın mümkün bütün hallerinin ihtimal toplamı 1 e eşittir. ∑P(Ei)= p(E1)+p(E2)+p(E3)+p(E4) ….=1 Bir olayın meydana gelme (p) ve gelmeme(q) ihtimalleri toplamı1 dir. p+q=1 bu tür ihtimallere birbirini tamamlayan ihtimaller denir. 1-p=q Paranın bir kez atlılması: P(Y)+P(T)=1 (belki dik gelebilir) iki kez atılması: P(YY)+P(YT)+P(TY)+P(TT)=1 Bir maç sonucu: P1(galibiyet)+P2(mağlubiyet)+P3(beraberlik)=1

136 Selami ÖZCAN İstatistik 136 İhtimale 3 yaklaşım (klasik, nispi, öznel) ortaya çıkma ihtimallerieşit klasik Sonuçların ortaya çıkma ihtimalleri eşit ise klasik yaklaşım Bir deneydeki basit olayın ihtimali 1 in tüm sonuç sayısına bölünmesine eşittir. P(Ei)=1/toplam sonuç sayısı P(A)= A olayında içerilen sonuç sayısı / toplam sonuç sayısı Paranın bir kez atılmasında yazı ihtimali P(Y):1/2=0,5 tura ihtimali P(T):1/2:0,5 Zarın bir kez atılmasında çift sayı gelmesi ihtimali P(A)= 2,4,6/1,2,3,4,5,6=3/6=0,5 Bir derneğin 100 üyesi(60 erkek, 40 kadın) var. Dernek başkanının kadın olma ihtimali nedir? 40/100=0,4 Öznel Öznel yaklaşım: ne sonuçlar eşit, ne de veri üretmek için tekrarlanabilen deneylerle karşılaşılabilir. Bir olay için sübjektif değer yargısına, tecrübe, bilgi ve düşünceye dayalı ihtimaldir. Göreliortaya çıkma ihtimalleri eşit değil Göreli (Nispi) sıklık yaklaşımı: ortaya çıkma ihtimalleri eşit değil, mesela; rastgele seçilen bir ailenin yıllık geliri TL den büyük olma ihtimali, civalı bir zarın atılması durumu, hileli paranın atılması durumu, 80 yaşındaki birinin bir sene sonra ölme ihtimali Yaklaşık ihtimal için göreli sıklık: bir deney n kez tekrarlanmış ve f kez bir A olayı gözlenmiş ise P(A)=f/n dir. Ör: rastgele 500 ürün seçilmiş bunlardan 10 tanesinin hatalı olma ihtimali nedir? 10/500=0,02 ilk üretilen ürünün hatalı olması, hatasız olma ihtimali ise:0,98 yaklaşık ihtimal söz konusu, gerçek ihtimal değil. Deney sonsuz(çok) kez tekrarlanırsa gerçek ihtimale yaklaşır.Buna Büyük sayılar Yasası denir. Ör: Ankara’dan rastgele seçilmiş bir ailenin ev sahibi olma ihtimali nedir? Ankara’da ikamet edenlerin ne kadarı ev sahibi bilinmiyor. Eşit değil Rastgele 1000 aile seçiliyor, 670 ev sahibi 330 değil P(A)=f/n 670/1000=0,670

137 Selami ÖZCAN İstatistik 137 Sayma Kuralı Sonuç sayısı az iken listelemekte sorun yok idi, fakat çok sayıda sonucu listelemek zor. Çok sayıda sonuç için sayma kuralı geçerlidir. Aynı anda vuku bulmaları imkansız olan birbirinden farklı k adet olay n defa tekrarlanırsa örnek: bir para 10 kez atılıyor sonuç: 2x2x2x2x2x2x2x2x2x2= =1024 İlk denemede k1, 2. denemede k2, n. Denmede kn dir. k1 x k2 x k3x..kn ör. 4 çeşit salata, 10 çeşit çorba, 3 çeşit meşrubat ve 6 çeşit tatlı var. Mümkün sonuç:4x10x3x6=720 Ör. bir deneyde ilk aşamada r tane, 2. aşamada n tane, 3. aşamada k tane sonuç olmak üzere 3 aşama bulunuyorsa bu deneyin toplam sonuç sayısı: r.n.k dır. Sonuç sayısının 3 ten az veya çok olması sayma kuralı için fark etmez. Bir para üç kez atılıyor. Her atılmada 2 durum(Y,T) vardır. 2x2x2=8 sonuç var. yyy, yyt, yty, ytt, tyy, tyt, tty, ttt Bir otomobil fabrikası 2 durum (sabit ve değişken faiz oranları) ile 36, 48 ve 60 ay vade yapmaktadır. Kaç farklı satış olur?2x3=6 sonuç Süper ligte 16 maç yapılmakta her maçın 3 durumu (galibiyet, mağlubiyet, beraberlik) söz konusu her takım için toplam sonuç sayısı nedir? 3x3x3x3x3x3x3x3x3x3x3x3x3x3x3x3= = knkn 2 10

138 Selami ÖZCAN İstatistik 138 Bileşen (Marjinal) ve Şartlı (bileşik) İhtimaller Herhangi bir başka olay dikkate alınmaksızın sadece bir olaya ilişkin ihtimale Bileşen (basit) ihtimal denir Bir olayın oluştuğunun bilinmesi durumunda diğer olayın meydana gelme ihtimaline şartlı (bileşik) ihtimal denir. Örnek: Çalışanların cevaplarına ilişkin iki yönlü sınıflama: 100 kişiye üst seviye yöneticilere çok yüksek ücret ödenmesi sorulmuş erkek (60) 15 onaylıyor 45 onaylamıyor; kadın (40) 4 onaylıyor, 36 onaylamıyor. P(E)=erkeklerin sayısı/tüm çalışanların sayısı=60/100=0,6 P(K)=kadınların sayısı/tüm çalışanların sayısı=40/100=0,4 P(A)=19/100=0,19 P(B)=81/100=0,81 Şartlı (Bileşik) ihtimalli iki yönlü sınıflama P(EA)=ihtimali hesaplanacak olay/gerçekleşmiş olay 15/60=0,25 (seçilen kişinin yüksek ücreti onaylayan ve erkek olma ihtimali 0,25 tir. CinsiyetOnaylıyor (A)Onaylamıyor (B)Toplam Erkek (E) Kadın (K)43640 Toplam Verilen olay Onaylıyor Onaylamıyor Erkek onaylıyor Kadın onaylıyor Kadın onaylamıyor Erkek onaylamıyor 15/19 4/19 45/81 36/81

139 Selami ÖZCAN İstatistik 139 Ayrık Olay, Ayrık Olmayan Olay Ayrık Olay, Ayrık Olmayan Olay Birlikte ortaya çıkmayan olaylara denir. Birlikte olamayan olaylara karşılıklı ayrık olaylar denir. Bu tür olayların ortak sonuçları bulunmamaktadır. Şayet iki ve daha fazla olay ayrık ise deneyin her tekrarında bu olaylardan en çok bir tanesi ortaya çıkmaktadır. Bir olayın ortaya çıkması, diğer olay ya da olayların ortaya çıkmasını dışta tutma. İki ayrık olayların ihtimalleri veya varsa olayların ihtimali toplanır. Deneyin herhangi bir tekrarında ortaya çıkacak sadece bir sonuç olduğu için nihai sonuçlar her zaman ayrıktır. Örnek:Zarın bir kez atılmasında a=çift b=tek c=5 ten küçük olması ihtimali=1,2,3,4 sayı 4/6= 0, 66 a ve b olayları ayrık fakat a ve c ayrık olmayan P(a, b)= 3/6 +3/6 =1(ayrık) P (a, c)=2,4 yani 2/6 ayrık değil Ör: hilesiz bir zar atıldığında 1 veya 5 gelme ihtimali P (1 veya 5)=1/6 +1/6=2/6=1/3 Ör: 8 kırmızı,5 sarı, 4 beyaz, 2 yeşil çekilen topun sarı veya beyaz olma ihtimali? İlk çekilen geri konuyor. 5/19+4/19=9/19=0, ba a c 5.

140 Selami ÖZCAN İstatistik 140 Bağımlı/Bağımsız Olay Bağımsız Olay: şayet bir olayın ortaya çıkması öteki olayın ortaya çıkma ihtimalini etkilemiyorsa bu iki olaya bağımsız olaylar denir. P(A/B)=P(A) veya P(B/A)=P(B) şartı yerine getirilmelidir. Bağımlı olaylar: bir olayın ortaya çıkması, diğer olayın ortaya çıkma ihtimalini etkiliyorsa bu olaya bağımsız olmayan veya bağımlı olay P(A/B) ≠ P(A) veya P(B/A) ≠ P(B) Örnek: 100 kaset (15 i bozuk), 60 ı 1.makinede (9 u bozuk), 40 ı 2.makinede (6 sı bozuk) üretilmiştir. Rastgele seçilen bir kasetin bozuk olma ihtimali nedir? D:rastgele seçilen kasetin bozuk olma iht. A:bu kasetin 1. makinede üretilmiş olma iht. P(D)=15/100=0,15 P(D/A)=9/60= 0,15 eşit çıktı bu iki olay (D ve A) bağımsız olaydır. Ayrık olaylar her zaman bağımlıdır. Bağımlı olaylar her zaman ayrık olmayabilir.

141 Selami ÖZCAN İstatistik 141 TAMAMLAYICI OLAY İki ayrık olayın bir deneyin tüm sonuçlarını içeriyorsa bu iki olay birbirinin tamamlayıcısıdır. Tamamlayıcı olaylar her zaman ayrık olaylardır. P(A) + P(A) =1 dir. Örnek: 5 makinenin 2si bozuk,rastgele seçilenin bozuk olma ihtimali nedir? A:seçilen makine bozuk, A:seçilen makine sağlam P(A)=2/5:0,40 P(A):3/5:0,60 Örnek: zarın bir kez atılması olayında 4’ten büyük çıkma (5,6) ihtimali nedir? P(A)=2/6=0,33P(A)=4/6=0,67 veya 1-0,33=0,67 A A S

142 Selami ÖZCAN İstatistik 142 OLAYLARIN ARA KESİTİ ve ÇARPMA KURALI Çarpma kuralı: bileşik ihtimal A n B veya AB P(A ve B)=P(A) x P(B) İki olay – 1.olayın bileşen ihtimali – 2.olayın şartlı ihtimali P(E) ve P(T) P(EveT)=P(E) x P(T/E) (27/40)x(7/27)=7/40=0,175 Erkek ve tamam Ör: 20 kaset 4 ü bozuk, 2 tane seçiliyor seçilen 2 kasetinde bozuk olma ihtimali (iadesiz çekiliş) S1: ilk seçilen kasetin sağlam olma iht.16/20 B1: ilk seçilen kasetin bozuk olma iht. 4/20 S2: ikinci seçilen kasetin sağlam olma iht.15/19 B2: ikinci seçilen kasetin bozuk olma iht.3/19 P(B1 ve B2)=P(B1) x P(B2/B1)=4/20 x 3/19=0,032 AB TamamRedToplam Erkek72027 Kadın4913 Toplam112940

143 Selami ÖZCAN İstatistik 143 BAĞIMSIZ OLAYLAR ÇARPMA KURALI A ve B gibi bağımsız 2 olayın bileşik ihtimali P(A ve B)= P(A) x P(B) Örnek. 2 adet yangın tüpü var herhangi birinin çalışmama ihtimali 0,02 yangın anında her ikisinin de çalışmama ihtimali nedir? P(1 ve 2)= P(1) x P(2) = 0,02x0,02=0,004 Ayrık olayların bileşik ihtimali İki ayrık olayın bileşik ihtimali her zaman 0 dır.P(A ve B)=0 Örnek: iş başvurusu kabul ve red, kabul ve reddin bileşik ihtimali 0 dır.

144 Selami ÖZCAN İstatistik 144 OLAYLARIN BİLEŞİMİ VE TOPLAMA KURALI Örnek: Erkek 45 kabul, 15 red, 10 çekimser; Kadın 80 kabul 110 red, 30 çekimserdir. Erkek ve red olma ihtimali: 70/300:0, /300:0,416 P(E/R)= 0,233x0,214=0,04499 P(E ve R):P(E)+P(R)-P(E/R) 0, ,416 – 0,04499=0,6 Ayrık olaylarda toplama kuralı P(A veya B)=P(A) + P(B) Toplama kuralı (yandaki örneğe göre) P (red veya çekimser) olma ihtimali nedir? 125/300+40/300=0,416+0,133 =0,563 AB A u B P(A veya B)=P(A)+P(B)-P(AveB)

145 Selami ÖZCAN İstatistik BÖLÜM: Kesikli Rassal Değişkenler Kesikli İhtimal Dağılımları Rassal Değişken: bir deney/gözlemin şansa bağlı sonucunda bir değişkenin aldığı değere (ihtimal ve istatistikte) rassal değişken adı verilir. Kesikli Rassal Değişken: yalnız belirli tamsayı değerleri alabilen, birbirini izleyen değerler arasında belirli boşluklar (sayımla elde edilen değerler) varsa kesikli rassal değişken sayılabilir. Ör.Satılan otomobil sayısı, bilet sayısı, izleyici sayısı, elbise sayısı, çocuk sayısı vb. Sürekli Rassal Değişken: ölçüm/tartımla elde edilen değerler, iki değer arasına sonsuz sayıda değer sıkıştırılabilen değişken sürekli rassal değişkendir. Ör. Boy uzunluğu, bir sorunun çözülme süresi, ağırlık, bir evin değeri(fiyatı) vb. Kesikli rassal değişkenin ihtimal dağılımına örnek Oto sayısı:0,1,2,3,4 Frekans(sıklık):30,470,850,490,160=2000 Nisbi frekans: 0,015;0,235;0,425;0,245;0,080=1 Kümülatif nisbi frekans:0,015;0,25;0,675;0,92;1 İhtimal dağılımı P(X):0,015;0,235;0,425;0,245;0,080=1 P(x) değerleri, X değerlerinin ihtimal dağılımını oluşturur P(2)=0,425 tir. 0≤ P(X) ≤1 ve ∑P(X)= X 0,0 0,1 0,2 0,3 0,4 0,5 0,015 0,235 0, 425 0,245 0,080

146 Selami ÖZCAN İstatistik 146 Kesikli bir Değişkenin Ortalaması ve Standart Sapması Kesikli Değişkenin Ortalaması Beklenen Değer (Matematik Ümit) E(x)=µ=∑x P(X)= n x P(X) X kesikli değişken, n adet denemede X1 olayı P1 ihtimalle, Xn olayı Pn ihtimalle meydana geliyorsa X1 in beklenen değeri E(x=1)=n.P1 Ör:3 er birimlik 1000 paket mal satın alınmakta kusur sayılarına ilişkin ihtimal tablosu aşağıda beklenen değeri bulunuz E(x=0)=n.P0=0x0,512=0 E(x=1)=n.P1=1x0,384=0,384 E(x=2)=n.P2=2x0,096=0,192 E(x=3)=n.P3=3x0,008=0,024 ∑x P(X)=0,6 µ=∑x P(X)=0,6 Kesikli Değişkenin Standart Sapması Ó=Standart sapma ss’nın büyük olması x değerlerinin ortalama etrafında geniş bir aralıkta değerler aldığını, SS küçük olması dar aralıkta dağıldığını gösterir. Gözlenen değerlerin ortalamaya yakın dağıldığını gösterir İstatistiksel değerlendirmelerde standart sapmanın karesi alınarak bulunan ve sigma kare ile varyans değeri hesaplanır Ör: x arızalı parça, 400 parça sevkiyatın ihtimal dağılımı tabloda var. Ortalama ve standart sapmayı bulunuz? Yorum: 400 parça sevkiyatın 1,2 standart sapma değeri ile 2,5 tanesi arızalıdır. X0123Top P(X)0,5120,3840,0960,0081 X012345Top. P(X)0,020,200,30 0,100,081 X P(X)=µ0,000,200,600,900,40 2,50 X X 2 P(X)=sigma0,000,201,202,701,602,007,70

147 Kesikli Dağılımın Beklenen Ümit ve Varyansı Selami ÖZCAN İstatistik 147 Örnek: Bir zar atılıyor. Anlaşmaya göre Ali babasından her atışta kaç gelirse o kadar TL para alacaktır. Atış başına Ali nin beklediği parayı bulunuz. X=x f(x) 11/6 21/6 31/6 41/6 51/6 61/6 1 Ali’nin atış başına ortalama kazancı Örnek: Bir kitaptaki bir sayfadaki yanlış sayısı ile ilgili X’in olasılık fonksiyonu şöyledir: P(x=0)=0.81 hiç yanlış olmaması P(x=1)=0.17 bir yanlış olması P(x=2)=0.02 iki yanlış olması Sayfa başına ortalama yanlış sayısını bulunuz. Sayfa başı ortalama 0.21 yanlış bulunur.

148 Selami ÖZCAN İstatistik 148 Faktöriyeller ve Kombinasyonlar Faktöriyeller ! 1’e kadar tüm pozitif sayıların çarpımından oluşur. Kural 1!=1, 0!=1 Sıra önemli olduğunda n adet olay n!=n(n-1) ör.6 kitap 6!=6x5x4x3x2x1=720 Sıra önemli olduğunda n adet olaydan x adeti n!/(n-x)! (permutasyon) 6 kitap 4lü şekilde kaç farklı şekilde dizilir. 6!/(6-4)! =360 Kombinasyonlar (C) Sıra önemli olmadığında n adet olaydan x adedinin seçilme yollarının sayısını vermektedir. n=toplam eleman sayısını x= her seferinde seçilecek eleman sayısı Not:n değeri x ten büyük en fazla eşit olmalı Örnek. 6!/4! (6-4)! =15 Ör. 20 öğretim üyesinden 5 tanesi rastgele proje için seçilecek, kaç farklı seçim olur 20!/5! (20-5)! =15.504

149 ÖNEMLİ BAZI KESİKLİ DAĞILIMLAR Üniform Dağılımı Bernoulli Dağılımı Binom Dağılımı-Poisson a Yaklaşımı Binom Dağılımı-Poisson a Yaklaşımı Poisson Dağılımı-Binom a yaklaşımı Poisson Dağılımı-Binom a yaklaşımı Geometrik Dağılım Hipergeometrik Dağılım Pascal (Negatif Binom) Dağılımı Selami ÖZCAN İstatistik 149

150 1. Üniform Dağılımı Kesikli bir şans değişkeni tanımlı olduğu tüm noktalarda eşit olasılık değerine sahip ise bir başka ifadeyle tanımlı olduğu değerlerin hepsinde olasılık fonksiyonun aldığı değer sabit ise bu kesikli şans değişkeni üniform dağılımına uygundur. Üniform dağılımı gösteren bir şans değişkeni k farklı noktada tanımlı ise olasılık dağılımı; şeklinde ifade edilir. 150

151 Üniform Dağılımının Beklenen Değer ve Varyansı = 151

152 Çözüm S = { x / 1,2,3,4,5,6 } Ortaya çıkan olaylar eşit olasılıklı olaylar x şans değişkeninin dağılımı k = 6 olan kesikli üniform dağılımına uygundur. 152 Örnek: Hilesiz bir zar atıldığında X şans değişkeni ortaya çıkabilecek farklı durum sayısını ifade ettiğine göre X’in olasılık dağılımını oluşturarak beklenen değerini ve varyansını bulunuz.

153 2. BERNOULLİ DAĞILIMI İki sonucu olan durum Başarılı başarısız Başarı 1 ve başarısızlık 0 Başarılı ihtimali p(x) Başarısızlık ihtimali q(x) veya 1-p p(X=x)= p(x=1) ve 1-p (x=0) P(X=x)= p² x (1-p)ª-³, x=0,1 beklenen değer: µ=E(x)=P dir Standart sapma (σ)=√p.(1-p) Ortalaması µ=∑x. P(x) Selami ÖZCAN İstatistik 153 Bir şans değişkeninin bernoulli dağılımı göstermesi için ilgilenilen süreçte bernoulli deneyinin varsayımlarının sağlanması gereklidir. Bernoulli Deneyinin Varsayımları: - Deneyler aynı koşullarda tekrarlanabilirlik özelliğine sahip olmalıdır. - Deneylerin yalnız iki mümkün sonucu olması gereklidir. - Başarı olasılığı (p),deneyden deneye değişmemektedir (Başarısızlık olasılığı q = 1-p ile gösterilir) - Denemeler birbirinden bağımsız olmalıdır.

154 ÖRNEKLER 1: Hilesiz bir para atılıyor. X=tura A=(T) S=(T,Y) T gelmesi başarı yani 1 dir. nA=1 ve n=2 p=P(X=1)=P(A)=nA/n = ½ 1-p=P(x=0)=1-p(x=1)=1/2 Benoulli dağılımı ½ dir. 0,5 tir. X rassal değişkenin ihtimal dağılımı P(X=x)= ½ x=0 ve ½ x=1 P(X=x)=(½)x (½)1-x x=0,1 olarak elde edilir. 2 2:Hilesiz iki zar atılıyor.Başarı ikisininde 6,6 gelmesi x=1 Başarısızlık ikisininde 6,6 gelmemesi x=0 A=(6,6) ve nA=1 p=P(x=1)= P(A)= nA/n=1/6 iki tane olunca 1/6x1/6=1/36 1-p=P(x=0)= 1-P(x=1)= 35/36 dır. P(X=x) (1/36)x. (35/36)1-x x=0,1 3: 100 kalemden 97 kusursuz. Rastgele seçilen bir kalemin kusursuz olma başarı (x=1) ihtimali Kusurlu olma başarısız (x=0) ihtimali nA=97 n=100 97/100=0,97 kusursuz iht. 1-0,97=0,03 kusurlu olma ihtimali P(X=x)=(0,97)x. (0,03)1-x x=0, Selami ÖZCAN İstatistik 154

155 x = 0 (as gelmemesi) x = 1 ( as gelmesi) S = { x / 0,1 } P( X = 0 ) = 48 / 52 P( X = 1 ) = 4 / Örnek: Bir deste iskambilden çekilen bir kağıdın as olup olmaması ile ilgileniyor. As gelmesi başarı olarak ifade edildiği durum için olasılık fonksiyonunu oluşturunuz.

156 Selami ÖZCAN İstatistik BİNOM (İKİ DURUM) İHTİMAL DAĞILIMI n:tekrarlı bir deneyde (toplam deneme sayısı), x kez istenen (başarı) sonuç gelmesi durumunda ihtimallerin bulunması için P(X) başarılı sonuç elde etme ihtimali X değişkeninin iki sonuçlu (kesikli) bir değişken olması gerek. Deneyin her tekrarından sonra bu iki sonuçtan birinin ortaya çıkması gerekir. Kız,erkek; yazı tura; başarılı, başarısız; hatalı hatasız; iki sonuçlu olaylar binom dağılımı ile çözülür. p=1-q X değerleri 0,1,2,3 … gibi kesikli değerler ve bu değerler için nokta ihtimalleri hesaplandığından binom dağılımı kesikli ihtimal dağılımıdır. P=0,5 binom dağılımı simetriktir. P <0,5 sağa; 0,5


157 Selami ÖZCAN İstatistik 157 Binom Dağılımına Örnek %15 kusurlu şansa bağlı alınan 3 örneğin en az iki mamulün kusurlu olma ihtimali nedir? Çözüm: P(x≥2)= P(x=2) + p(x=3) (3/2)0,15x0,15x0,85+(3/3)0,15x0,15x0,15x0,85.sıfırıncı kuvveti =0,0574+0,0034=0,0608 %6,08 Örnek: %10 hatalı, 4 birimlik mamulun en çok 2 sinin hatalı olma ihtimali nedir? Çözüm: n=4 P(x≤2)=P(x=0)+P(x=1)+p(x=2) =0,6561+0,2916+0,0486=0,9963=%99,63 Ör. Bir fabrikada üretilen tv lerin arızalı olma ihtimali %5 tir. 3 tv seçtiğimizde 1.nin arızalı olma ihtimali (binom) nedir? Çözüm: 0,1354=%13,54 yanda çözümü Örnek:Kargo şirketi paketlerinden %2 si zamanında ulaşmıyor. Bir müşteri 10 paket veriyor. 1 tanesinin zamanında ulaşmama ihtimali? (10/1) 10x(0,02)1x(0,98)9=0,1667 En çok 1 tanesinin zamanında ulaşmama ihtimali?p(x=0)+p(x=1)=0,9838 0!=1 Bir sayının 0. kuvveti 1 dir. Binom Dağılımının Ortalama(np) ve Standart Sapması(√npq) Ör:Bir şehirde yaşayanların oyların %58 i A partisi almış, bu şehirden 25 kişi seçildiğinde X’in(A partisine oy verenlerin) ihtimal dağılımının ortalaması ve standart sapması nedir? Ortalama:25x0,58=14,5 Standart sapma:√25x0,58x0,42:2,47 Yorum: seçilen 25 kişiden 2,47 standart sapmayla ortalama 14,5 kişinin A partisine oy vermesi beklenmektedir.

158 Bir fabrikada üretim yapan makinalardan birinin ürettiği ürünlerin 0,09’u kusurlu olarak üretilmiş bulunmaktadır. Bu ürünlerden 4 adedi rastgele seçilmiştir. Hiç özürlü ürün seçilmemiş olma olasılığı nedir? P(k;n;p) = n! k!(n-k)! p k.q n-k P(0;4;0,09) = ! 0!(4-0)! 0, , = 0,6857 BİNOM DAĞILIMINA ÖRNEK

159 Selami ÖZCAN İstatistik POİSSON DAĞILIMI Poisson, binom gibi kesikli bir ihtimal dağılımıdır. Verilen bir aralıkta (zaman, hacim aralığı vb) tekrar sayısının ortalaması biliniyorsa poisson kullanılır. X ile gösterilen tekrar sayısına ilişkin herhangi bir değerin ihtimali hesaplanabilir. Üzerinde durulan olayın meydana gelme ihtimali çok küçüktür. n in büyümesi P nin küçülmesi halinde binom yerine poisson formülü kullanılır. Yani np değeri 5 ten küçük olduğunda ʎ : poisson dağılımının ortalaması, bu dağılımın varyansı da ʎ eşittir. Matematik sabiti e ise yaklaşık olarak 2,71828 dir. µ ortalama= ʎ = σ ² varyans, standart sapma σ =√ ʎ Moment çarpıklık ölçüsğ ά 3 =1/ ʎ moment basıklık ölçüsü:3+1/ ʎ Not: poisson dağılımı normalden daha dik ve sağa çarpıktır. ʎ büyüdükçe dağılım simetrikleşir. Örnek: bir hastanenin acil servisine bir günde gelen hasta sayısı; bir makinede üretilecek 100 parçadan hatalı parça sayısı; bir mağazadan 1 haftada satılan buzdolabı sayısı (randevulu gelen hasta rassal olmadığı için poisson uygulanamaz) Örnek: bir çamaşır makinesi ayda ortalama 3 kez arızalanmakta, poissona göre gelecek ay iki kez arızalanması ihtimali ve en çok bir kez arızalanması ihtimali nedir? Çözüm: a) P(x=2)= b)P(x ≤ 1)=p(X=0)+p(X=1)

160 Poisson Dağılımının İhtimal Fonksiyonu l :belirlenen periyotta ortaya çıkan olay sayısı x :ortaya çıkma olasılığı araştırılan olay sayısı S = { x / 0,1, 2, 3, ….., } 160

161 Poisson Dağılımının Beklenen Değer ve Varyansı Beklenen Değer Varyans Beklenen değeri ve varyansı birbirine eşit olan tek dağılıştır. 161

162 Örnek: Bir mağazaya Cumartesi günleri 5 dakikada ortalama olarak 4 müşteri gelmektedir. Bir Cumartesi günü bu mağazaya, a) 5 dakika içinde 1 müşteri gelmesi olasılığını, b) Yarım saate 2’den fazla müşteri gelmesi olasılığını, ÖDEV: 1 saatte en çok 1 müşteri gelmesinin ihtimalini hesaplayınız. a) 4 P ( x = 1 ) = ? b) 5 dk’da 4 müşteri gelirse, 30 dk’da 24 müşteri gelir.  24 P ( x > 2 ) = ?  P( x > 2 ) = 1 – [P(x=0)+P(x=1)+P(x=2)] 162

163 Selami ÖZCAN İstatistik 163 Poisson Dağılımına Örnek Örnek1: A bankasında günde 2 hesap açılıyor, herhangi bir günde 6 yeni hesap açılması ihtimali, en çok 3 yeni hesap açılması ihtimali, en az 7 hesap açılması ihtimali nedir? a) p(x=6)= ortalama( ʎ )=2, x=6 formülde yerine koyarsak: 0,0120 b) P(X≤3)=P(X=0)+P(x=1)+p(x=2)+p(x=3)=0,8571 c)p(x≥7)=1-p(x<7):1-[p(x=0)+p(x=1)+p(x=2)+p(x=3)+p(x=4)+p(x=5)+p(x=7)]=0,0045 Örnek2: ortalaması x=2,6 poisson dağılışı gösteren bir değişkenin standart sapması nedir? Çözüm: ortalama (µ)=landa ( ʎ )=varyans (ó)=2,6 dır. Standart sapması√2,6=1,61 dir. Ör:Bir otomobil satış yerine ayda ortalama 150 müşteri gelmektedir.Herhangi bir günde satış yerini açmayan galeri sahibi %kaç ihtimalle en az 3 müşteriyi kaçırmıştır.(ay=30) Günlük ortalama:150/30=5 tir. 3 veya daha fazla müşteriyi kaçırma ihtimali (iki durum ya 3 ten sonsuza kadar olan ihtimaller hesaplanacak veya 3 ten küçük olanlar (x=0,1,2) hesaplanıp 1 den çıkarılacaktır. P(x≥3)=1-p(x=0)+p(x=1)+p(x=2)=0,8754 %87,54 Örnek: bir havaalanından her 100 uçaktan biri mecburi iniş yapmaktadır. Herhangi bir ayda 4000 uçaktan en çok 2 sinin mecburi iniş yapması ihtimali nedir?0,2381

164 Bir fabrikada üretilen ürünler 0,001 olaslıkla bozuktur. Rastgele örnekleme ile 2000 adet alınmıştır. 4 adet ürünün bozuk olma olasılığı nedir? = n. p = E(x)= V(X) =  P(x=k) = e k k! = ,001 = 2 P(x=4) = e = 0, ! POİSSON DAĞILIMINA ÖRNEK

165 BİNOM’UN POİSSONA YAKLAŞIMI POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p 20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR Selami ÖZCAN İstatistik 165

166 POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p 20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR. BİNOM POİSSON n= 5, p= 0,2 n= 20, p=0,05 =np=1 0,328 0,410 0,205 0,051 0,359 0,377 0,189 0,060 0,368 0,184 0,061 X0123X0123 POİSSON’UN BİNOMA YAKLAŞIMI

167 Selami ÖZCAN İstatistik HİPERGEOMETRİK DAĞILIM Binom ve hipergeometrik dağılım aynı tür olaylara uygulanır. Örnekleminin şekli önemli, binomda sınırsız anakütleden iadesiz çekilişler veya sınırlı anaküteleden iadeli çekilişler (çekilişler birbirinden bağımsız), bu yüzden binomdaki p değeri çekilişten çekilişe değişiklik göstermez. Hipergeometrikte ise; sınırlı anakütleden iadesiz çekiliş veya bir sonraki çekiliş bir önekine bağımlıdır. Örnek:2 istatistik, 3 bilgisayar, 4 yöneylem hocasından 3 kişilik sayısal yöntemler jürisi oluşturulacaktır. Jüride en az bir istatistik hocasının bulunması ihtimali nedir? Çözüm: P(x ≥1)=p(x=1)+P(x=2) P(x ≥1)=(2/1).[(9-2)/(3-1)]/9/3 + (2/2).[(9-2)/(3-2)]/9/3 P(x ≥1)=42/84+7/84=49/84=05833 Örnek:not ortalaması 85 in üzerinde olan 4 iktisat, 7 işletme öğrencisinden 3 kişilik grup oluşturulacak, grupta bir iktisatçı bulunması ihtimali?N=11 n=3 A=4 Formulde x yerlerine 0 ve 1 konacak P(x≤1)=p(x=0)+p(x=1)=0,7212

168 İçinde 10 sağlam ve 4 arızalı mal bulunan bir topluluktan 5 mal alınmıştır. Bunlardan üçünün sağlam çıkma olasılığı nedir? N=14 A=10 n= 5 x= 3 P(X=3) = c c c 5 = 0,3596 P(X=x) = A c x. N-A c n-x NcnNcn HİPERGEOMETRİK DAĞILIMA ÖRNEK

169 Bir imalat hattında kusurlu parça oranı 0,6 olarak bilinmektedir. 5. Parça üretildiğinde 3. Kusurlu parçanın ortaya çıkma olasılığı nedir? P (x)= X-1 C k-1. p. q k x-k X=5 K=3 P (5)= 5-1 C ,6. 0, = 0, PASCAL(NEGATİF BİNOM) DAĞILIMI- ÖRNEK

170 Selami ÖZCAN İstatistik 170 Sorular 1. İstatistik birimlerinin sahip oldukları özelliklere ne ad verilir? a) Veri b) Şık c) Parametre d) Sabit e) değişken 2. 1,1,2,3,5,8,11,13 basit serisinin medyanı kaçtır? a) 4 b) 4,5 c) 5 d) 5,5 e) 6 3. Bir zar 3 kez atıldığında kaç olası sonucu vardır. a) 112 b) 143 c) 165 d) 210 e) Sınıflar:10-20, 20-30, 30-40, 40-50, 50-60, 60-70, Frekans:1,5,7,12,20,24,25 den çok:25,24,20,18,13,5,1 50 den büyük gözlem sayısı kaçtır. a) 8 b) 12 c) 13 d) 18 e) Anakütleden uygun tekniklerle çekilen birimlerin oluşturduğu alt topluluğa ne ad verilir? a) Sınıf b) Örneklem c) Evren d) Grup e) istatistik 6. X=1,3,5,6,8,9 kareli ortalaması nedir? a) 4,31 b) 5 c) 5,33 d) 5,5 e) 6

171 Selami ÖZCAN İstatistik X=12,23,34,45,56 Değişim aralığı nedir? a) 12 b) 17 c) 34 d) 44 e) X=3,4,6,8,9 standart sapması nedir? a) 12,28 b) 5,2 c) 5,53 d) 5 e) 6 9. Bir örneklemin gözlem değeri için hesaplanan karakteristik değere ne ad verilir? a) Ortalama b) Frekans c) İstaitik d) Anlam frekansı e) parametre den 10 kadar sayılar arasından seçilen bir sayının 2 ve 3 e bölünebilen bir sayı olma ihtimali kaçtır? a) 1/10 b) 1/5 c) 3/10 d) 1/2 e) 1/8 11. Xi ortalama (µ) standart sapma (sigma)=10 normal dağılım göstermektedir. X=55 değerinin standart normal değeri (z) kaçtır? a) 0,5 b) 1 c) 1,5 d) 2 e) Kusursuz bir madeni para 2 kez atılmış, 1. atış yazı iken 2.ninde yazı gelme ihtimali kaçtır? a) ¼ b) 1/3 c) ½ d) 2/3 e) 3/4

172 Selami ÖZCAN İstatistik Histogramın temel noktalarının birleştirilmesi ile elde edilen grafik türünün adı nedir? a) Pasta grafiği b) Frekans poligonu c) Sütun grafiği d) Alan kodu e) Serpilme diyagramı gözlem değerinden oluşan basit bir serinin aritmetik ortalaması 50 ise bu serideki gözlem değerleri toplam kaçtır? a) 0,5 b) 5 c) 40 d) 60 e) Sınıflar: 10-15, 15-20, 20-25, Frekans: 40, 27, 18, 10, 5 /100 serinin frekans eğrisi aşağıdakilerden hangisidir? a) Sola eğik b) J biçiminde c) Sağa eğik d) Ters J e) U biçiminde 16. Ortalamalarla ilgili ifadelerden hangisi yanlıştır? a) v 17. Birimle ilgili ifadelerden hangisi yanlıştır? a) q 18. Aşağıdakilerden hangisi tam sayımı engelleyen nedenlerden biri değildir? a) Maliyetli olması b) Ölçülen birimde tahrip yapması c) Anakütle hacminin küçük olması d) Zaman sınırlaması e) Anakütle hacminin sonsuz sayıda olması 19. X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 ortalaması kaça eşittir? a) 1 b) 1,6 c) 2,7 d) 3 e) 3,8 20. X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 standart sapması kaça eşit? a) 1 b) 3 c) 7 d) 9 e) 10

173 Selami ÖZCAN İstatistik Serilere ilişkin ifadelerin hangisi doğrudur? a) c 22. Aşağıdaki serinin modu nedir? X=3,5,8,13,21,34 Frekans=1,7,2,9,6,4 a) 7 b) 9 c) 11,5 d) 13 e) 14, birimlik örneklem 3. tabakadan seçilen birim sayısı nedir? a) 4 b) 15 c) 20 d) 35 e) Standart normal dağılmış (z) bir değişken P(0,52)

174 Selami ÖZCAN İstatistik BÖLÜM: Sürekli İhtimal Dağılımları En çok bilinen sürekli ihtimal dağılımları Üstel Dağılım Gama Dağılımı Weibull Dağılımı Normal Dağılım

175 Elektronik cihazların ömür ve güvenirlik (reliability) hesaplamalarında çok kullanılan bu dağılımın olasılık yoğunluk fonksiyonunun grafiğinin şekli aşağıdadır. Bu dağılımı tanımlayan en önemli özellik arıza oranıdır( ). X f(x) 0,2 0,16 0,12 0,08 0, = 5 = 10 = ÜSTEL DAĞILIM

176 ÜSTEL DAĞILIM OLASILIK FONKSİYONU: f(x) = e - x X > 0 ÜSTEL DAĞILIM ORTALAMASI: ÜSTEL DAĞILIM VARYANSI:  = : SİSTEMDEKİ ARIZA ORANI ( >0)  : SİSTEMDEKİ ARIZA ZAMANI ORTALAMASI BİRİKİMLİ ÜSTEL DAĞILIM FONKSİYONU: F(a) = P(x 0 ZAMANA BAĞLI ALET GÜVENİRLİĞİ: R(t) = e - t  = 1 ÜSTEL DAĞILIM

177 Seri üretim yapan bir fabrikadaki kusurlu mamullerin saat başına =1/4 parametreli bir poisson sürecine uygun olduğu belirlenmiştir. İç denetçinin saha çalışması için üretim sisteminin başına saat 10:00’ da geldiği varsayıldığında; A. İlk kusurlu ürünün ortaya çıkmasının beklenen zamanını, B.İlk kusurlu ürünün en erken sat 11:00’de üretilmesi olasılığını, C.İlk kusurlu ürünün en geç saat 14:00’de üretilmesi olasılığını bulunuz. c. P(X=4) = 1-e =1-e = 1-e = =  = 1 1 1/4 b. P(X  1) = = e = e = R(t) = e - t t (1) a. E(X) = = = 4 saat - t -0.25(4) ÜSTEL DAĞILIM-ÖRNEK

178 X f(x) 0,2 0,16 0,12 0,08 0, = 1; r=1 = 1; r=2 = 1; r=3 2. GAMA DAĞILIMI

179 f(x) = r (r) ( x) e - x r-1 X > 0 ; r >O ; >O GAMA DAĞILIMI OLASILIK FONKSİYONU: GAMA DAĞILIMI ORTALAMASI:  = r GAMA DAĞILIMI VARYANSI:  = 2 r 2 BİRİKİMLİ GAMA DAĞILIMI FONKSİYONU: F(a) = 1-  0 00 ( t) r-1 e - t dt F(a) =1-  e r-1 k=0 - a k! ( a) k r (r) GAMA DAĞILIMI

180 Olasılık Kuramı ve İstatistik bilim dallarında Weibull dağılımı (Waloodi Weibull anısına isimlendirilmiş) bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu ise : Burada x ≥ 0 ve x 0 şekil parametresi ve λ > 0 Ölçek parametresi olurlar. Weibull dağılımı için Yığmalı(Cumulative) olasılık Fonksiyonu bir gerlmiş üstel (stretched) fonksiyondur. Yaşama, hayatta kalım ve yetmezlikle yıkım süreçlerini inceleyen verilerin analizi alanında Weibull dağılımı çok elastik olup kolayca değiştirilebildiği için çok kullanılmaktadır. Değişik parametre değerleri kullanılarak normal dağılım, üstel dağılım gibi çok popüler diğer istatistiksel dağılımların davranışların Weibull dağılımı kullanarak aynen taklid etme imkânı bulunmaktadır. Eğer k = 3.4 ise, Weibull dağılımı Normal Dağılım’ına benzerlik gösterir. Eğer k = 1 ise o zaman Weibull dağılımı Üstel Dağılımı’na dönüşür. 3. WEIBULL DAĞILIMI

181 4. NORMAL DAĞILIM – İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. – Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. – Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir. – Standart sapması, frekans eğrisi çan şeklinde olan simetrik dağılımdır. – Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, medyan ve modları eşittir. – Normal dağılımı meydana getiren birimler ölçme veya tartma yoluyla elde edilen verilerdir. – ± ∞ sayıda değer alır. – Moment çarpıklık katsayısı: ά 4 =3 Normal dağılım fonksiyonu f(x) = 1/σ x √2  e ½(x-µ x /σ x ) ² e:2,71828  :3,14159 µ: anakütle ortalaması σ:anakütle standart sapması, x:herhangi bir sürekli değişkendir Selami ÖZCAN İstatistik 181

182 Dağılım özelliğinin önemi nedir Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir

183 NORMAL DAĞILIMIN KRİTERLERİ Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. Normal eğri altında kalan alan 1 e eşittir. Normal dağılımda nokta tahmini yapılamaz bu sebeple aralık tahmini (x 1 ve x 2 arası) yapılır.

184 STANDART NORMAL EĞRİ ALANLARI X-µ X σ X %68,27 ==>±1σ x %95,54 ==>±2σ x %99,73 ==>±3σ x X değerlerinin standart z değerlerine dönüştürülmesi gerekir. Z tablosundaki Z değerleri 0 ile 3,99 arasındadır. Z=2,14 ün normal eğri alanı nedir? Z tablosundaki normal eğri alanlarını bulmak için; İlk sütundaki 2,1 ve ilk satırdaki 0,04 2,14 ün normal eğri alanı 0,4838 dir.

185 Örnek1: Z 1 =-1,44 ile Z 2 =2,06 arasındaki alan kaçtır? P(-1,44≤z≤2,06)=0,4251+0,4803=0,9054 Örnek 2: Z 1 =-1,44 ile Z 2 =-0,51 arasındaki alan kaçtır? P(-1,44≤z≤-0,51)=0,4251-0,1950=0,2301 Örnek 3: P(z ≤-1,44) değerini bulunuz? P(z ≤-1,44)=0,5-0,4251=0,0749 Örnek 4: P(z ≥-1,44) değerini bulunuz? 0,4251+0,5=0, Selami ÖZCAN İstatistik 185

186 Örnek 5: ortalaması 5 kg, standart sapması 0,15 kg olan bir prosesten tesadüfi bir malın ağırlığı 5,05 kg dan fazla olma ihtimali nedir? X=5,05 standart z değerine dönüştürelim X-µ X σ X Z=(5,05-5,00)/0,15=0,33 tür. P(x≥5,05)  P(z ≥0,33)=0,5-0,1293=0,3707 olur Selami ÖZCAN İstatistik 186

187 Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir : 1. Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak. 2. Varolan verilere parametrik olmayan bir test uygulamak KESİKLİ DAĞILIMLAR NORMALE YAKLAŞTIRILIR. (BİNOM, POİSSON VE HİPERGEOMETRİK DAĞILIM)

188 n yeteri kadar büyük olması durumunda binom kesikli değişkeni yaklaşık olarak ortalaması np, varyansı npq olan bir normal dağılıma yaklaşır. Ayrıca p ihtimal değerinin 0.5’e yaklaştığı bütün durumlarda binom dağılımı yerine normal dağılım kullanılabilir. Binom dağılımı kesikli standart z normal dağılımı süreklidir. Dönüştürmek için; z = = X -   (X+0,5) - np npq BİNOM DAĞILIMININ NORMAL’E YAKLAŞIMI n  30, np  5 ve p=0.50 Bu durumda; E(X)=  = np ve Varyans  = npq z = = X -   npq X - np

189 n = 150  30 p = 0,40 ~0,50 np = 60  5 BU ŞARTLARDA BİNOM NORMAL DAĞILIMA YAKLAŞIR. z = X - np  =np=(150)(0,40)=60 npq Örnek 1: Büyük bir şirkettte çalışan personelin % 40’ bayandır. Çalışanlar arasından rastgele olarak 150 kişi seçilmiştir. Seçilen kişiler içinde kadınların sayısının arasında olma ihtimali nedir? Dağılımın ortalaması =nxp =150x0,40=60 Standart sapması √nxpxq. √(N-n).(N-1) √150x0,40x0,60=6 Seçilen kişiler arasında bayanların sayısının arasında olma ihtimali %73.33’tür. Z 1 = = - 0,75 (56-0,5) TABLODAN 0,2734 Z 2 = = 1,75 (70+0,5) TABLODAN 0, ,7333

190 Örnek 2: Bir fabrikada üretilen mamullerin %10 hatalı, 150 birim alınıyor, 10 mamulun hatalı olma ihtimali kaçtır? Selami ÖZCAN İstatistik 190 Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq. √(N-n).(N-1) √150x0,10x0,90=3,67 X= 10 değerine ±0,5 ilave edilirse; X 1 =10,5 X 2 =9,5 Z 1 =10,5-15/3,67=-1,23 Z 2 =9,5-15/3,67=-1,50 P(x=10)=P(-1,5

191 POİSSON DAĞILIMININ NORMAL’E YAKLAŞIMI Poisson dağılımında Parametresi, =np≥5 eşitliğine uygun olması durumunda Poisson dağılımı normal dağılıma yaklaşır. Bu Durumda ihtimallerin Hesaplanmasında; P(x=k) = e k k! Formülü yerine  =  2 = =nxp eşitliğinden istifade ederek X - = X -   z = √

192 n= p= 0,002  = =np=20000(0,002)=40  5 olduğundan poisson dağılımı normale yaklaşır. V(X)= = 40 z1 =z1 = = = = - 0,1 0,0398 X = = 0,5 z2=z2= + 0,1915 0,2313 X - Örnek 1: Bir hastalığın iyileştirilmesi için geliştirilen yeni bir ilaç hasta üzerinde uygulanmıştır. İlacın yan etkisinin olması ihtimali 0,002 dir. Buna göre ilacın verildiği hastalarda yan etkisi görülenlerin sayısının arasında olma ihtimali nedir?

193 Örnek 2: fabrika malzeme yokluğu sebebiyle günde 12 kez durmaktadır. Rastgele seçilen bir günde malzeme yokluğu sebebiyle günde 15 ve daha az durma ihtimali kaçtır? =12 ise z=15,5-12/ √12=1,01 P(x≤15)=P(z≤1,01)=0,5+0,3438=0,8438 Örnek 3: bir önceki örneğe göre günde 12 kez durma ihtimali kaçtır? X1=11,5 X2=12,5 Z1 =11,5-12/√12=-0,14 Z2=12,5-12/√12=0,14 P(x=12)=P(-0,14

194 HİPERGEOMETRİK DAĞILIMIN NORMALE YAKLAŞIMI Nxp≥5 olduğunda hipergeometrik dağılım normale yaklaşır. Sınırlı anakütleden iadesiz çekilişler yapıldığı için standart sapma düzeltme faktörü ile çarpılır. Standart z formülündeki anakütle ortalaması ve standart sapma yerine hipergeometrik dağılımın ortalama ve standart sapması yazılarak ihtimal dağılımı hesaplanır. Z= (x-np)/ √npq. √(N-n/N-1) x değişkeni süreklilik düzeltmesine tabi tutulur Selami ÖZCAN İstatistik 194

195 Hipergeometrik dağılımın normale yaklaşımına Örnekler Örnek 1: 1000 mamulun %10 hatalı, iadesiz alınan 150 adetin ise 8 den az olma ihtimali kaçtır. Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq. √(N-n).(N-1) σ=√150x0,10x0,90 x √( )/(1000-1) σ=3,39 8 den az dendiği için 7,5 Z=7,5-15/3,39=-2,21 P (x<8) =P(Z<-2,21)=0,5-0,4864=0,0136 %1,36 Örnek 2: 1.Örneğe göre 10 ve daha fazla olma ihtimali kaçtır? (10 ve yukarısı başlangıç 9,5) Z= 9,5-15/3,39= -1,62 P(x≥10)= P(z ≥-1,62)=0,4474+0,5= =0,9474 %94, Selami ÖZCAN İstatistik 195


"İSTATİSTİK I Doç. Dr. Selami ÖZCAN. 01.03.2016Selami ÖZCAN İstatistik 2 BİRİNCİ BÖLÜM İSTATİSTİKLE İLGİLİ İSTATİSTİKLE İLGİLİ TEMEL KAVRAMLAR." indir ppt

Benzer bir sunumlar


Google Reklamları