Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

OLASILIK VE İSTATİSTİK I

Benzer bir sunumlar


... konulu sunumlar: "OLASILIK VE İSTATİSTİK I"— Sunum transkripti:

1 OLASILIK VE İSTATİSTİK I
İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü OLASILIK VE İSTATİSTİK I 1. Hafta: Öğr. Gör. Berk Ayvaz

2 İstatistik Nedir ? İstatistik kelimesi günlük hayatımızın her aşamasında sıkça duyduğumuz bir kavram haline gelmiştir. Bu kavrama farklı manalar yüklenmesi de kaçınılmaz olmuştur. Örnek olarak borsa istatistikleri, hava durumuna ilişkin istatistikler, medya kanallarına ilişkin takip edilme istatistikleri, finansal göstergelere ilişkin istatistikler vs. Bu durumda, istatistik kavramına sayı anlamı verilmektedir. Fakat burada sayı anlamına gelen istatistikler sıradan sayılar değil bilimsel yöntemlerle tespit edilen sayıları ifade etmektedir. İstatistik; ‘Araştırmanın amacına yönelik olarak var olan bir problemin belirlenmesi, istatistik birimlerinin tanımlanması ve bunlara ilişkin değişkenlerin belirlenmesi, değişkenlere ilişkin verilerin toplanması, bu verilerin seriler ve tablolar yardımıyla gösterilmesi, serilerin çözümlenmesi ve yorumlanması sürecini içeren bir yöntemler bilimidir.’ İstatistik, veri toplama, özetleme ve yorumlama, sonuçları ortaya koyup çizelgelere yansıtma vs. süreçleri için bir prensip ve metodoloji sağlayan bir kavramdır (Johnson and Bhattacharyya, 2010).

3 İstatistik Bilimi İstatistik Bilimi
İnsanoğlu hayatının her anında bir karar verme süreci ile karşı karşıyadır. Bu kararları verirken sahip olduğumuz bilgileri kullanır ve bu bilgileri düşünme ya da fikir sürecinden geçirerek bir sonuç elde etmeye çalışırız. SORU: “Karar aşamasında sahip olduğumuz bilgiler acaba yeterli mi? …..Bu bilgileri nasıl elde ediniriz?” v.b. sorulara vereceğimiz cevaplar bizi istatistiğe yönlendirecektir. İhtimallerin ve belirsizliklerin bu kadar çok olduğu bir hayatta elbetteki alınacak kararların, içinde bulunulan şartların en iyi biçimde analiz edilip değerlendirilmesi ile alınması gerekmektedir. Bu değerlendirme sürecinde en güçlü yardımcı araçlardan birisi istatistiktir.

4 Tasviri (Tanımlayıcı)
İstatistik Bilimi İstatistik bilimi; verilerin toplanması, düzenlenmesi, özetlenmesi, takdimi, analizi ve bu analizler vasıtasıyla elde edilen sonuçların yorumlanması ve bir karara bağlanması ile ilgilenir. İstatistik Tasviri (Tanımlayıcı) Tahlil (Açıklayıcı) Frekans dağılımları Yer ölçüleri: aritmetik ort., geometrik ort., harmonik ort., kareli ort., mod, medyen vs. Dağılma ölçüleri: ortalama sapma, standart sapma, varyans, değişim aralığı Çarpıklık ve Basıklık Örnekleme teorisi Hipotez testleri Regresyon analizi Korelasyon analizi

5 Kavramlar : Anakütle ve Örneklem
Araştırma sorusu: Su kaç derecede kaynar? Anakütle ve Örneklem: Bir istatistiki araştırmada araştırmaya konu olan bütün birimlere anakütle denir. Örneğin; öğretim yılında İTİCÜ öğrencilerinin kitap okuma alışkanlığı üzerine yapılacak bir araştırmada, İTİCÜ öğrencilerinin her biri istatistik birimi iken bu öğrencilerin tümünün oluştur­duğu topluluğa anakütle denir. Nüfus sayımı için anakütle Türkiye’dir. Anakütle bazen tek tek sayılamayacak kadar çok büyük olabilir. Bundan dolayı büyük anakütleler için araştırmalar; zaman, maliyet, personel, ulaşım, vb. nedenlerden dolayı tüm birimler yerine daha az sayıdaki örneklemler seçilerek yürütülür. Bu örneklemlerden elde edilen sonuçlar tüm anakütleye teşmil edilir. Örneklem anakütlenin alt kümesidir. Bir üniversitede yapılacak olan bir araştırmada tüm öğrenciler anakütle iken anakütle içinden seçilecek olan 100 kişilik bir grup ise örneklem olarak adlandırılır.

6 Parametre ve İstatistik
ANAKÜTLE parametre istatistik Anakütledeki bütün birimler üzerinden hesaplanan ölçülere parametre denir. Anakütleyi temsil eden bir örneklemdeki verilerden hesaplanan ölçülere ise istatistik denir. İstatistik hesaplamaları tasviri (tanımlayıcı) istatistiğin konusudur. Eldeki istatistik değerlerini kullanarak anakütle parametreleri hakkında bir kısım yargılara varmak tahlili (Açıklayıcı) istatistik veya istatistik analizin konusunu teşkil eder. Ana kütle ya da örneklemde yer alan her birime gözlem ya da denek denir. Gözlem (ya da denek) sayısı aşağıdaki biçimde simgeleştirilmektedir. Ana Kütledeki Gözlem Sayısı : N Örneklemdeki Gözlem Sayısı: n Örnek: Parametre ( AnakütleOrtalaması, AnakütleVaryansı) İstatistik (Örneklem Ortalaması, Örneklem Varyansı) The major objectives of statistics are: 1. To make inferences about a population from an analysis of information contained in sample data. This includes assessments of the extent of uncertainty involved in these inferences. 2. To design the process and the extent of sampling so that the observations form a basis for drawing valid inferences.

7 Veri Türleri İstatistik birimlerin sahip oldukları ve farklı değerler alabilen, diğer istatistik birim­lerinden ayırt edilmesini sağlayan özelliklere değişken denir. Değişkenin aldığı de­ğerlere de gözlem veya ölçüm değerleri denir. Sayısal (kantitatif) veya sayısal olmayan (kalitatif) bir özellikte belirgin bir şekilde görülen farklılıklar değişken ile gösterilebilir. Örneğin; İhracat-İthalat Değerleri , Cari Fiyat, kalite kontrol oranları vs… Sayısal değişkenler de kesikli ve sürekli olmak üzere iki kısma ayrılırlar. Sürekli değişkenler belirli bir aralıkta sonsuz sayıda değer alabilen değişkendir. Kesikli değişkenler sadece belirli tamsayı değerleri alabilen değişkenlerdir. Ölçülen ve tartılan değişkenler sürekli, sayılabilen değişkenler ise kesikli değişkendir. Örnek: Bir sınıftaki öğrencilerin ağırlıkları (sürekli değişken), bir sınıftaki kız ve erkek öğrenci sayısı (kesikli değişken) Değişken Türleri Sayısal Kantitatif Nicel Sayısal Olmayan Kalitatif Nitel

8 Ölçek Türleri İstatistiki araştırmaya konu olan veriler aşağıdaki 4 ölçekten biri ile ölçülmektedir: Sınıflama (Nominal) Ölçeği Sıralama Ölçeği Aralık Ölçeği Oran Ölçeği Sınıflama Ölçeği : Bir cisim veya olayı belirli bir isme göre diğer bir cisim veya olaydan ayırmaya yarar. Sınıflama ölçeğinde değişkenlerin aldığı değerler sayısal bir büyüklük ifade etmezler. Bu sayı ve simgeler arasında bir büyüklük veya küçüklük söz konusu olmadığından matematiksel işlemler yapılamaz. Bu değerler değişkenlere ait bazı özellikleri tanımlarlar. Örneğin Cinsiyet değişkeni için “1” değeri “Kadın”ları, “2” değeri “Erkek”leri temsil edebilir. Bu çerçevede Medeni Durum, Meslek, Doğum Yeri gibi değişkenlere ait ölçümler için sınıflama ölçeğinin kullanımı uygun olacaktır.

9 2- Sıralama Ölçeği Sınıflama ölçeğinde değişkenlerin aldığı değerler önem derecesi ya da üstünlükleri baz alınarak sıralanır. Kullanım yerleri şu şekildedir. Bir yarışa katılan koşucular, yarışı bitirme zamanlarına göre, birinciden sonuncuya kadar sıralanırken; Belirli bir mamül hakkında tüketicilerin beğenileri « hiç beğenmedim, biraz beğendim, çok beğendim» gibi sıralanabilir. Katılım Düzeyi (Kesinlikle Katılıyorum, Katılıyorum, Karasızım, Katılmıyorum, Kesinlikle Katılmıyorum), Sıklık Düzeyi (Hiç, Nadiren, Genellikle, Her Zaman) Öğrenim Durumu (İlköğretim, Lise, Lisans, Yüksek Lisans), Yönetim Kademesi (Alt, Orta, Üst) vb. değişkenler için Sıralama (Ordinal) Ölçeğinin kullanımı uygun olacaktır. Servis kalitemizden memnun musunuz? Hiç memnun değilim Biraz memnunum Oldukça memnunum Çok memnunum Fazlasıyla memnunum

10 3- Aralık Ölçeği Bu ölçme düzeyinde değişkenin aldığı sayısal değerler birimle ifade edilir ve sayı­lar arasındaki farklar anlamlıdır. Üzerinde durulan değişken belirli iki değer arasında sonsuz değer alabilir. Ancak bu ölçme düzeyi için kesin bir sıfır başlan­gıç noktası yoktur. Bu ölçekteki 0 değeri, ölçülen karakteristiğin olmadığını göstermez. Örneğin, sıcaklık değişkeni için birim, santigrat derece (°C) olduğundaki sıfır başlangıç noktası (0°C) ile fahrenheit (°F) olduğundaki sıfır başlangıç noktası (0°F) farklı sıcaklık ölçümlerini verirler. Çünkü 0°C’ye karşı gelen değer 32°F dır. Aynı şekilde ölçüm karakteristiklerinden birinin değeri diğer değişken değerinin katlarıyla ifade edilemez. Buna verilecek en açık örnek ısı ölçümleridir. 4°C, 2°C’den 2 kat büyük değildir. Sıcaklık, başarı, performans gibi sayısal değişkenleri ölçmek için kullanılır.

11 4- Oran Ölçeği Yukarıdaki ölçeklerin en hassas olanıdır.
Ölçülen karakteristiğin 0 olması o karakteristiğin olmadığını gösterir. Ölçülen değişken değeri diğer değişken değerinin katları ile ifade edilebir. Bir cismin ağırlığının 0 kg olması onun olmadığını gösterirken, 10 kg gelen bir cisim 2 kg gelen cismin 5 katı ağırlıktadır. Aylık gelir, ağırlık, uzunluk, hız gibi değişkenleri ölçmek için kullanılır. Bu ölçekte başlangıç “0” noktasıdır. Aralık ölçeğinin oran ölçeğinden temel farkı bir başlangıç noktasının bulunmamasıdır.  Diğer bir ifade ile “0” değeri aralık ölçeğinde yokluk ifade etmez. Örneğin termometrede görülen “0 °C” belirli bir anlam taşır. Oysa oran ölçeğinde yer alan “0 Kg” bir yokluk ifadesidir.

12 ÖDEV 6 çalışma grubu oluşturuldun.
Bu gruplar ders kapsamındaki ödevleri beraber yapacaklar. ÖDEV 1 Herbir grup birbirinden bağımsız olarak 4 ölçek için 4 örnek oluşturup haftaya ders öncesinde sunum yapacak.

13 Sınıflandırılmış seri
Frekans Dağılımları Bir araştırmaya konu olan anakütledeki tüm verileri veya örneklemdeki verileri alt alta ya da yan yana dizdiğimizde basit bir seri elde etmiş oluruz. Bu seriyi özetlemek ve daha anlaşılır hale getirmek istediğimizde sınıflandırma ya da gruplandırma yoluna gideriz. Sınıflandırmada serideki herbir değerin karşısına o değerin frekansını yani tekrarlanma sayısını yazarız. İlgilenilen değişkenin almış olduğu farklı değerlerin küçükten büyüğe sıralanması ve bu değerlerin karşısına kaç kez tekrar ettiğinin (frekansı) yazılmasıyla oluşturu­lan istatistik serisine “frekans serisi” denir, Mesela Ali ismi, bir seride 10 kez geçiyorsa bu değerin frekansı 10’dur. Farklı birimlerin çok olması halinde yani gözlem sayısı çok olduğu durumlarda sınıflandırma işlemi verilerin özetlenmesine kafi gelmez. Bu gibi durumlarda gruplandırma yoluna gidilir. Sınıflandırılmış seri X frekans 5 6 10 20 1 4 2 8 Gruplar frekans 6 20 10 5 Gruplandırılmış seri Gruplamada hesap kolaylığı açısından aralıklar genellikle eşit alınır. Gruplandırılmış seride matematiksel işlemler yapabilmemiz için, herbir sınıfı bir sayı ile temsil etmemiz gerekir.

14 Gruplandırılmış seri İlgilenilen değişken değerlerinin, belirlenen gruplara (aralıklara) ayrılması ve bu sı­nıflara giren gözlem sayısının ayrı bir sütuna yerleştirilmesiyle oluşan seriye “grup­landırılmış seri” denir, Frekans serisini, gruplandırılmış seri haline dönüştürürken sınıf aralığı büyüklüğü Sturges Kuralı ya da araştırmacının görüşüne bağlı olarak belirlenir. Sınıf aralığının key­fî olarak belirlenmesinde göz önüne alınması gereken kriter birbirine yakın gözlem de­ğerlerinin bir araya getirilmesidir. Genellikle, en az 5 en fazla 20 sınıf sayısı önerilir. Sturges kuralı yardımıyla sınıf sayısı ve buna bağlı olarak da sınıf aralığı büyük­lüğü belirlenir. Gruplandırılmış seride her sınıfın en küçük değerine alt sınır değe­ri, en büyük değerine de üst sınır değeri denir. Her bir sınıftaki üst sınır ile alt sı­nır arasındaki farka da sınıf aralığı yada büyüklüğü (genişliği) denir.

15 Sturges kuralı Sturges Kuralı Xb = En büyük gözlem değeri
Xk = En küçük gözlem değeri N= Gözlem sayısı k = Sınıf Sayısı h = Sınıf Aralığı Büyüklüğü k = 1 + (3,322) * log(N) Sınıf büyüklüğü = en büyük değer−en küçük değer sınıf sayısı h= ( Xb - Xk) / k N ≤k Genel olarak 5 ≤k ≤20 seçilmesi benimsenir. Eşit aralıklı k sınıflı gruplandırılmış bir seri oluşturmak için serideki en büyük değerden en küçük değer çıkarılarak k sayısına bölünür. Elde edilen değer sınıf büyüklüğüdür. Bu değer k adet sınıf oluşturuluncaya kadar serideki en küçük değere kümülatif olarak eklenir.

16 Örnek 1 Tabloda gösterilen sıralanmış seriyi sınıf sayısı k= 4 olacak şekilde gruplandırılmış seri haline getiriniz. 26,40 34,45 35,33 61,62 136,74 154,24 160,26 173,23 177,12 177,60 261,68 273,38 293,00 351,95 366,76 414,32

17 Çözüm 26,40 34,45 35,33 61,62 136,74 154,24 160,26 173,23 177,12 177,60 261,68 273,38 293,00 351,95 366,76 414,32 Sınıf sayısı k: 4 olsun. Sınıf büyüklüğü = en büyük değer−en küçük değer sınıf sayısı h= 414,32−26,4 4 = 96,98 1 26,4 123,38 2 220,36 3 317,34 4 414,32 26,4 +96,98

18 Örnek 2 120 Öğrencinin Aylık Harcamaları (Frekans Serisi)
Aylık Harcamalar (t) Frekanslar (ft) 200 1 250 300 320 2 380 3 400 5 420 500 7 535 4 550 600 10 650 12 700 8 750 15 800 820 840 875 900 6 950 980 1000 1050 Toplam Frekans 120 Tablo’da verilen sınıflandırılmış seri gruplandırılmış seriye dönüştürülmek istendiğinde; k = 1 + (3.322) * log(N) Xb =1050 Xk= =200 N=120 k = 1 + (3.322) * log(120) k = 1 + (3.322) * (2.079) k = = 7.906 k~ 8 Bu örnek için sınıf aralığı büyüklüğü (h); h= ( Xb - Xk) / k h= ( )/8 h =106.25~ 107

19 120 Öğrencinin Aylık Harcamaları için oluşturulan gruplandırılmış seri
Çözüm 2 120 Öğrencinin Aylık Harcamaları için oluşturulan gruplandırılmış seri Aylık Harcama (t) Frekanslar (ft) ’den az 3 ’den az 10 ’den az 12 ’den az 18 ’den az 20 ’den az 34 ’dan az 16 ’dan az 7 Toplam 120

20 Gruplandırılmış Seri Sürekli gruplandırılmış bir seride her sınıfın alt ve üst değerlerine sınıf sınırları denir. Bu rakamlardan küçük olan alt sınır, büyük olan ise üst sınır olarak adlandırılır. 26,40 178,25 330,10 481,95 633,80 sınıf sınırları Kesikli gruplandırılmış bir seride bir üst sınıfın alt sınırından bir alt sınıfın üst sınırı çıkarılıp ikiye bölünerek, bu değer üst sınıf değerinden çıkarılır ve alt sınıf değerine eklenerek sınıf uçları sınıf sınırlarına dönüştürülür. Sınıf için üst sınıf hesabı: 178,25+ 0,375 = 178,625 2. Sınıf için alt sınıf hesabı: 179- 0,375 = 178,625 26,40 178,25 179 330,10 331 481,95 482 633,80 = 𝟏𝟕𝟗−𝟏𝟕𝟖,𝟐𝟓 𝟐 = 0,375

21 Frekans Dağılımları Gruplandırılmış bir seride her sınıfın ilk rakamı alt sınıf ucu, son rakamı ise üst sınıf ucudur. Sürekli gruplandırılmış serilerde sınıf uçları sınıf sınırlarına eşittir. Daha önce belirtildiği gibi bir sınıfın üst ve alt sınırları arasındaki farka sınıf büyüklüğü denir. Sınıf büyüklüğü :178,25-26,40=151,85 Sınıf değeri, alt ve üst sınıf uçlarının veya alt ve üst sınıf sınırlarının toplanıp ikiye bölünmesiyle elde edilir. Sınıf değeri: (26,4+178,25)/2=102,32 26,40 178,25 330,10 481,95 633,80

22 Frekans Dağılımları Serideki herbir frekansın toplam frekansa bölünmesiyle nisbi frekanslar elde edilir. Bu frekanslar nisbi frekans dağılımını teşkil eder. Gruplar Frekans 6 20 10 5 Gruplandırılmış seri 41 Nisbi frekans 6/41 20/41 10/41 5/41 41/41 Kümülatif frekans 26 36

23 Örnek 3 Bir üniversite kampüsünün başka bir lokasyona taşıması ile ilgili öğretim üyeleri ile anket yapılmıştır. 152 öğretim üyesi kampüsün taşınması fikrini desteklerken, 77 öğretim üyesi tarafsız kalmakta ve geriye kalan 51 öğretim üyesi bu fikre karşı çıkmaktadır. Buna göre ankete verilen cevapların frekansını ve nisbi frekanslarını hesaplayınız.

24 Örnek 4 Aşağıdaki tabloda bir fabrikanın kalite kontrol departmanı tarafından tespit edilen hatalı ürün sayıları gösterilmektedir. Bu tablodaki verileri sıralı seri olarak gösteriniz. Frekans ve nisbi frekansları hesaplayınız.

25 Çözüm Değer Frekans Nisbi Frekans 1 7 7/30 2 9 9/30 3 6 6/30 4 5 3/30
5/30 Toplam 30

26 Örnek 5 Yukarıdaki tablo için 12-14, 15-17, 18-20, ve aralıkları için frekans ve nisbi frekans değerlerini bulunuz.

27 Çözüm Aralıklar Frekans Nisbi Frekans 12-14 2 2/40 15-17 8 8/40 18-20
11 11/40 21-23 10 10/40 24-26 9 9/40 Toplam 40 1

28 Histogram Bir dikdörtgenler dizisidir.
Bu dikdörtgenlerin tabanları gruplandırılmış serideki herbir sınıfın büyüklüğünü, yükseklikleri ise sınıf frekansını gösterir. Bu dikdörtgenlerin üst kenarlarının orta noktaları birleştirilmek suretiyle elde edilen grafiğe frekans poligonu adı verilir. Nisbi ya da kümülatif frekans dağılımlarına ait histogramları elde etmek için bu histogramdaki dikey eksene nisbi veya kümülatif frekanslar eklenmelidir.

29 Örnek 6 Gruplar Frekans 5.00-7.75 7.75-10.50 10.50-13.25 13.25-16.00 6
20 10 5 Gruplandırılmış seri

30 Kategorik Verilerin Grafikle Gösterilmesi
Kesikli sayısal veriler ve sayısal olmayıp kategorilere ayrılabilen veriler de grafiklerde gösterilebilir. TV izlenme oranları, partilerin oy oranları vs. grafiklerle gösterilmesi mümkündür. Bu tip verileri çok farklı grafik türleri ile göstermek mümkündür…

31 Sütun Grafiği Yatay eksek kategoriler, dikey eksen bunların frekanslarından oluşur. Sütunlar birbirine bitişik yada ayrık olabilir. Eğitim durumu Kişi sayısı Doktora 5 Y. Lisans 8 Lisans 15 Önlisans

32 Sütun Grafiği

33 Daire Grafiği Bu grafikte genellikle kategorilerin nisbi frekansları 360 ile çarpılarak daire içinde alacakları dilimin büyüklüğü belirlenir. Eğitim durumu Kişi sayısı Nisbi frekans Dilim büyüklüğü Doktora 5 5/33 (5/33)*360 Y. Lisans 8 8/33 (18/33)*360 Lisans 15 15/33 (15/33)*360 Önlisans

34 Çalışma Soruları

35 Çalışma Sorusu 1 İstatistik Notları 65 70 90 69 55 78 84 50 63 61 57 33 95 28 45 94 88 60 43 Yandaki grafikte 21 öğrencinin istatistik dersinden aldıkları notlar görülmektedir. Buna göre: Notları değişim aralığını bulunuz. Notları basit bir seri haline getiriniz. Bu verileri sınıf büyüklüğü 10 olacak şekilde gruplandırıp, herbir grubun frekansını bulunuz. Her sınıfa ait sınıf değeri ve sınıf sınırlarını bulunuz. C şıkkındaki değerleri dikkate alarak histogram çiziniz. Bu verileri 5 grup olacak şekilde gruplandırdığımızda sınıf büyüklüğü değeri kaç olur?

36 Toplam denetim ödemeleri
Çalışma Sorusu 2 Hesapları denetlenen 692 Avustralya şirketinden alınan denetim dışı ücretlerin toplam denetici ödemeleri içindeki payları ilişikteki çizelgede gösterilmiştir. Toplam denetim ödemeleri Şirket sayısı 84 113 112 85 77 58 75 48 40 Göreli sıklıkları ve birikimli nisbi sıklıkları bulup histogram çiziniz.

37 Çalışma Sorusu 3 Bir ampül fabrikasında üretilen mamüller arasından tesadüfi olarak 400 tanesi seçilmiş ve bunların dayanma sürelerine ait frekans dağılımı aşağıda gösterilmiştir. Buna göre: Bütün sınıfların alt ve üst sınırlarını, Bütün sınıfların sınıf değerlerini, Altıncı sınıfın nisbi frekansını Dayanma süresi 6000 saate çıkmayan ampüllerin yüzdesini, Dayanma süresi 9000 saat veya daha fazla olan ampüllerin yüzdesini bulunuz. Sınıf Dayanma süresi Ampül sayısı 1 14 2 46 3 58 4 76 5 68 6 62 7 48 8 22 9 400


"OLASILIK VE İSTATİSTİK I" indir ppt

Benzer bir sunumlar


Google Reklamları