Sunuyu indir
Sunum yükleniyor. Lütfen bekleyiniz
1
MÜH 100 İSTATİSTİK Yrd. Doç. Dr. Veysel Gazi
TOBB Ekonomi ve Teknoloji Üniversitesi Elektrik-Elektronik Mühendisliği Bölümü
2
AMAÇ Kitle ve örneklem arasındaki farkı öğrenmek Betimsel istatistiği kullanmayı öğrenmek (veri sıralaması, merkezsel eğilim ölçüleri, dağılım ölçüleri, vs.) Histogram çizme ve okumayı öğrenmek Normal dağılımı ve standart normal dağılımı tanımlamak Olasılık hesabı için Z-tabloları kullanmak
3
İstatistik İstatistik olasılık kuramının yöntemlerine bağlı bir daldır
- betimsel (descriptive) istatistik: veri toplamak, düzenlemek, özetlemek, sunmak ve incelemek tümevarımsal istatistik (statistical inference): verilere dayanarak sonuçlar çıkarmak sonuçlara dayanarak kararlar almak mühendisler tarafından çok kullanılır (mesela kalite kontrol için)
4
Kitle ve Örneklem Kitle (Population) – üzerinde çalışılan tüm gruba yada istatistiksel sonuçların genişletileceği gruba kitle denir örnek: bütün sınıf, tüm ülke insanları, tüm kanser hastaları Örneklem (Sample) – kitlenin bir alt kümesidir örnek: bir takım, rasgele seçilen bazı insanlar Bütün kitle hakkında sonuçlara varabilmek için genelde örneklem kullanılır.
5
Neden örneklem kullanılır?
Kitle çok büyük olabilir dünyadaki tüm insanlar, uzaydaki tüm yıldızlar. Kitleye ulaşmak imkansız olabilir tarih öncesi insanları Kitleyi incelemek tehlikeli olabilir araba enkazları/kazaları, patlamalar Kitleyi ölçmek zor olabilir atomların alt parçacıkları Ölçüm örneği kullanılmaz hale getiriyor olabilir vidanın dayanma gücü
6
Örnek: Sağındaki ve solundaki kişilerin yaşlarının ve kendi yaşının ortalamasını alarak sınıf yaş ortalamasını tahmin et. Aldığın 3 kişilik örneklem hangi şartlarda sınıfı temsil etmez?
7
Merkezsel Eğilim Ölçüleri
Bir kitleyi (yada bir örneklemi) tek bir sayı ile tanımlamak/betimlemek istersek ne kullanırız? Ortalama (Mean) – aritmetik ortalama Mod (Mode) – en çok tekrarlanan (en sık görülen) değer. Ortanca/Medyan (Median) – veri kümesinin “orta” değeri.
8
Ortalama nedir? Ortalama verilerin toplamının veri sayısına bölümüdür.
9
Kitle Ortalaması μ = kitle ortalaması xi = veriler
N = kitledeki tüm gözlemlerin sayısı
10
Örneklem Ortalaması = örneklem ortalaması xi = veriler
n = örneklemdeki gözlemlerin sayısı
11
Ağırlıklı Ortalama Ağırlıkları w1,w2, …,wk, olan x1,x2, …, xk, verilerinin ağırlıklı ortalaması:
12
Örnek Ders Kredi Not Ağ. Not Fiz 101 4 AA (4.0) 16.0 Kim 101 BB (3.0)
12.0 Müh 100 2 BA (3.5) 7.0 Mat 101 CB (2.5) 10.0 Türk 101 CC (2.0) 4.0 İng 101 DD (1.0) 2.0 MAK 101 3 DC (1.5) 4.5 Toplam 21 55.5 Yandaki tabloda verilen ders ve notlar için ağırlıklı ortalama:
13
Mod Nedir? mod – kesikli verilerde (yada kesikli aralıklara gruplanmış verilerde) en fazla görülen değer. Örnek: MÜH100 dersini alan öğrencilerin çoğu EEM bölümünden.
14
Ortanca nedir? Ortanca (medyan) – veriler sıralanmış olmalı tek sayıda gözlem var ise ortanca orta değerdir çift sayıda gözlem var ise ortanca iki orta değerin ortalamasıdır Verilerde sapan değerler var ise ortanca verileri ortalamadan daha iyi betimler. Örnek: Şu an bu odadaki kişilerin yaş ortalaması.
15
Dağılım Ölçüleri Verilerin merkeze göre dağılımı tanımlayan ölçüler
değişim aralığı ortalama mutlak sapma standart sapma varyans
16
Değişim Aralığı Nedir? Değişim Aralığı (Range) – en büyük ve en küçük değerler arasındaki fark. Örnek: A üniversitesinin B bölümünün tavan puanı 361 ve taban puanı 349 ise. En düşük (Minimum) = 349 puan En yüksek (Maksimum) = 361 puan Değişim aralığı = = 12 puan
17
Ortalama Mutlak Sapma Herhangi bir verinin ortalamadan sapması
Tüm sapmaların toplamı sıfırdır Ortalama Mutlak Sapma (OMS)
18
Standart Sapma Kitle için Sapma Örneklem için Varyans = s2
19
Standart Sapma Verilerin dağılımı hakkında önemli bilgi vermektedir.
Matematiksel analiz için OMS’den daha uygun.
20
s ve s Farkı s (örneklem varyansı) s‘nın (kitle varyansının) bir tahminidir. s’nin hesaplanmasında n-1 kullanılır ve bu daha iyi sonuç verir. Eğer n büyük ise n ve n-1 kullanımı arasındaki fark önemsizdir.
21
Önemli bir özellik Standart sapmayı Gauss 1700’lerde yıldızların ölçülen konumlarındaki gözlenen hataları açıklamak için icat etmiş. Bugün ise kalite kontrolden finansal risklerin ölçülmesi/hesaplanması’na kadar birçok yerde kullanılıyor.
22
Verilerin Düzenlenmesi
Bir gözlemde yada deneyde elde edilen verilere ham veri (raw data) denir. Veriler genelde incelemeden önce büyükten küçüğe (yada tersi) sıralanır (sort edilir). Sıralanmış veriler sınıflandırılır. Sınıflar tüm verileri kapsayacak ve her veri sadece bir sınıfa dahil olacak şekilde tanımlanır. Her sınıftaki eleman sayısına sınıf frekansı denir. Veriler histogram kullanarak grafiksel olarak gösterilebilir.
23
Örnek Müh 100 dersinin notları aşağıdaki gibi olsun 50 54 60 55 73 74
62 64 63 47 57 58 59 51 49 67 48 46 71 52 65 69 53 66 75 70 56 61 68 37
24
Örnek Notlar büyükten küçüğe sıralanır.
En yüksek not (maksimum) = 75 En düşük not (minimum) = 37 Not değişim aralığı = 75 – 37 = 38 Ortalama = 58’dir. Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir. Sıralanmış notlar 9 sınıfa ayrılır Sınıflar 35-39, 40-44,45-49,…,75-79’dır En fazla not sınıfındadır – bu sınıf mod sınıfıdır.
25
Örnek Her sınıfın frekansına göre histogram çizersek.
26
Veri Dağılımları Verinin “şekli” frekans histogramı ile anlaşılır.
Frekans histogramlarında genelde oransal frekans (OF = sınıf frekansı/toplam frekans) kullanılır. Çoğunlukla veriler “çan-eğrisi” şeklinde bir dağılım gösterirler ve bu tür dağılıma “normal” dağılım (distribution) denir. Gauss yıldızların konum hatalarının “normal” dağılım gösterdiğini gözledi.
27
Normal Dağılım Normal dağılım bazen “Gauss” dağılımı olarak da adlandırılır. ortalama OF Oransal (Relative) Frekans x
28
Standart Normal Dağılım
Alan = 1.00 için
29
Bilinmesi Gereken Bazı Şeyler
z=-1 ve z=1 (x=-s ve x=s) arasındaki alan ’dır. z=-2 ve z=2 (x=-2s ve x=2s) arasındaki alan ’dır. z=-3 ve z=3 (x=-3s ve x=3s) arasındaki alan ’dır. z=-4 ve z=4 (x=-4s ve x=4s) arasındaki alan pratik olarak 1.0’dır.
30
Bilinmesi Gereken Bazı Şeyler
Normal eğrisinde orta değer alanı %50’lik iki eşit bölgeye ayırır. Normal dağılım eğrisi toplam 1.00 alana sahiptir. “z-Tabloları” standart normal dağılım eğrisinin altındaki alanı gösterir ve z-eksenindeki herhangi iki nokta arasındaki alanı hesaplamak için kullanılabilir.
31
Z-Tabloları Kullanarak Olasılık Hesabı
Örnek: Kitabınızdaki Ek-C’deki Z-tablosunu kullanarak z= -1.0 ve z= 2.05 arasındaki alanı bulunuz. Tablodan: z = 1.0 için alan = Simetriden dolayı z = -1.0, için de alan = Tablodan: z= 2.05 için, alan = Toplam alan = = “Kuyrukların” alanı = =
32
Özet Merkezsel Ölçüler Dağılım Ölçüleri Normal Dağılımı ortalama mod
ortanca Dağılım Ölçüleri değişim aralığı varyans standart sapma Normal Dağılımı
Benzer bir sunumlar
© 2024 SlidePlayer.biz.tr Inc.
All rights reserved.