Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ

Benzer bir sunumlar


... konulu sunumlar: "ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ"— Sunum transkripti:

1 ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ
İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI

2 Yorumlama süreci Tahminler ve testler Populasyon Örnek İstatistikleri

3 Örnek Tipleri Örnek Tipi Olasılık Dışı Olasılık Basit Sistematik
Probability Samples Selection is based on chance Subjects are chosen based on some known probabilities Eliminates or reduces bias Random refers to procedure not the data: The outcome cannot be predicted because it is dependent upon chance Non Probability Samples Do not have above characteristics Done for time and convenience Basit Sistematik Tabakalı Kümeli Şans Yargı Kota Kitle 3

4 Niçin Örnek? Anakütle parametrelerinin örnek değerleri(örnek istatistikleri) yardımıyla tahmin edilmesine imkan sağlamak modern istatistiğin önemli bir görevidir. Anakütlenin tamamı incelenmez. Anakütleden bir şans örneği alınır. Elde edilen örnek değerlerinin anakütle parametresi yerine kullanılması için iki şart vardır: Örnek şans örneği olmalı. Anakütledeki her birimin örneğe girme şansı eşit olmalı Örnek yeterince büyük olmalı Pragmatic Reasons If Chrysler wished to census past purchasers’ reactions, millions of car buyers would have to be contacted Accurate & Reliable Results Reasonable accuracy though not perfect - sampling error! May be more accurate than census since less chance of nonsampling errors (e.g., data entry) Bureau of the Census uses samples to check the accuracy of the US Census. If the sample shows possible source of error, the census is redone. Destruction of Test Units e.g., Mean Life of Light Bulbs

5 Örnekleme; İadeli örnekleme:Çekilen birimin anakütleye tekrar iade edilmesidir. İadesiz örnekleme:Çekilen birim anakütleye iade edilmez. Bir anakütleden alınan şans örneklerinin her birisi için örnek istatistikleri hesaplandığında örnekleme dağılımları ortaya çıkar: Bir örneğin ortalaması hesaplanmışsa elde edilen dağılımı ortalamaların örnekleme dağılımı, Her örnek için p oranları hesaplandığında oranların örnek dağılımı elde edilir.

6 İki ayrı anakütlenin karşılaştırılması yapılıyorsa farklarla ilgili örnekleme dağılımı ortaya çıkar:
Her iki anakütleden alınan nA ve nB büyüklüğündeki örneklerin ortalamaları hesaplanmış ve bu ve değerleri arasındaki farklar belirlenmişse elde edilen dağılım ortalamalar arası farkların örnekleme dağılımıdır. Anakütlelerden alınan örnekler için oranlar hesaplanmış ve bu oranların anakütleler itibariyle gösterdikleri farklılıklar ortaya konulmuşsa elde edilen dağılım oranlar arası farkların örnekleme dağılımıdır.

7 Örnek hacmi arttıkça (n  30) ...
Bir populasyon parametresini tahminlemek için şans değişkenleri kullanılır: Örnek ortalaması, örnek oranı, örnek medyanı… Merkezi Limit Teoremi Örnek hacmi arttıkça (n  30) ... Örnekleme dağılışı normal dağılıma yaklaşır.

8 ORTALAMALARIN ÖRNEKLEME DAĞILIMI
Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi bir tahmincisidir. Her biri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden daha azdır. Standart sapma bir örneğin değişkenliği hakkında bilgi verirken, Ortalamaların örnekleme dağılımının değişkenliği standart hatayla gösterilir.

9 Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi, ortalamaların örnekleme dağılımının değişkenliğini azaltıcı bir faktördür. Ana kütle standart sapması bilindiğinde standart hata eşitliğiyle hesaplanır. Standart z değerleri formulüyle hesaplanır. Ortalamaların örnekleme dağılımında yerini alır.

10 Herhangi bir değerinin standart Z değerine dönüştürmesinde
eşitliği kullanılır. Örnekleme dağılımı Standart normal dağılım = 1 X z = 0 Z X Z

11 Normal populasyondan örnekleme
Populasyon dağılımı Merkezi eğilim Yayılım yerine koyarak örnekleme = 10 Örnekleme dağılımı n = 4 X = 5 n =16 X = 2.5 11

12 Alıştırma Türk telekomda çalışan bir operatörsünüz. Uzun mesafeli telefon görüşmeleri  = 8 dk. &  = 2 dk. İle normal dağılmakta. Eğer 25 aramalık örnekler seçerseniz örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında olacaktır? 12

13 Çözüm X 7 . 8 8 Z . 50 n 2 25 X 8 . 2 8 Örnekleme dağılımı Z . 50 Standart normal dağılım n 2 25 = .4 = 1 X Z .3830 .1915 .1915 7.8 8 8.2 -.50 .50 Z 13

14 ORANLARIN ÖRNEKLEME DAĞILIMI
Oranların örnek dağılımının ortalaması anakütle oranına eşittir. ÖRNEK: Büyük bir alışveriş merkezinde YTL’den fazla alışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem dağılımının standart hatası nedir?

15 ORANLARIN ÖRNEKLEME DAĞILIMI
Aynı örnek için YTL’den fazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini hesaplayınız. 0.1233 0.3621 -2.18 -1.09 0.4854

16 ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir.

17 ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası,

18 ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir.

19 ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:

20 İstatistiksel metotlar
Tanımlayıcı istatistikler Yorumlayıcı istatistikler Hipotez Testi Tahminleme

21 Yorumlayıcı İstatistikler
Aralık tahminleme ve hipotez testlerini içerir. Amacı populasyon karakteristikleri hakkında karar vermektir. Populasyon?

22 %95 eminim ki, , 40 ile 60 arasındadır.
Tahmin süreci Populasyon Şans örneği %95 eminim ki, , 40 ile 60 arasındadır. Ortalama = 50 Ortalama, , bilinmiyor

23 Bilinmeyen populasyon parametreleri tahminlenir...
parametresini Örnek istatistiğiyle Tahminle! Ortalama Oran P p 2 Varyans s Farklar  1 2 1 2

24 Tahminleyicilerin Özellikleri
1. Sapmasızlık Sapmasız Sapmalı B A N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir.

25 Tahminleyicilerin Özellikleri
2. Tutarlılık (Kararlılık) Küçük örnek hacmi Büyük örnek hacmi A B Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir. ,’nın tutarlı tahmincisidir.

26 Tahminleyicilerin Özellikleri
3. Etkinlik Etkin Tahminci A B Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir.

27 İstatistiksel Tahminleme
Nokta Tahmini Aralık Tahmini Populasyon parametresinin tek bir tahmin değerini verir Populasyon parametresinin tahmin aralığını verir. Nokta tahmini kullanılarak hesaplanır.

28 Güven Aralığı Tahmininin Elemanları
Bir değer aralığı verir. Populasyon parametresine yakınlık hakkında bilgi verir. Olasılık terimleriyle ifade edilir. Güven Aralığı Tahmininin Elemanları Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı Örnek istatistiği Güven aralığı Alt güven sınırı 28 Üst güven sınırı 28

29 Güven aralığı x _ Örneklerin 90% Örneklerin 95% Örneklerin 99%

30 Güven Seviyesi Bilinmeyen populasyon parametresinin aralık içine düşme olasılığıdır. %(1 - = güven seviyesi :Parametrenin aralık içinde olmaması olasılığıdır. Tipik değerler %99, %95, %90

31 Aralıklar ve güven seviyesi
_ Ortalamanın örnekleme dağılımı x /2 /2 1 -  _ X = x aralık Aralıkların %(1 - ) ‘ı ’yü kapsar. % ‘sı kapsamaz. Notice that the interval width is determined by 1- in the sampling distribution. Çok sayıda aralık

32 Aralık genişliğini etkileyen faktörler
Verilerin yayılımı () Örnek hacmi X = X / n Güven seviyesi (1 - ) © T/Maker Co. Have students explain why each of these occurs. Level of confidence can be seen in the sampling distribution.

33 Populasyon ortalamasının güven aralığının hesaplanması
Parametre= istatistik ±hata

34 Güven Aralığı Tahminleri
Güven Aralıkları Oran Varyans Ortalama bilinmiyor biliniyor n30 n<30 Z dağılımı t dağılımı 34

35 ORTALAMALAR İÇİN GÜVEN ARALIĞI
x _ Örneklerin 90% Örneklerin 95% Örneklerin 99% 35

36 ORTALAMALAR İÇİN GÜVEN ARALIĞI
Örnek: Bir fabrikada üretilen 100 mamulün ortalama ağırlığı 1040 gr standart sapması 25 gr bulunmuştur. Bu imalat prosesinde üretilen mamullerin ortalama ağırlığı %95 güvenle hangi aralıktadır? %95 için z değeri ± 1.96 0.475 /2=0.05/2=0.025 z=-1.96 = 0 z=1.96 Z

37 ORTALAMALAR İÇİN GÜVEN ARALIĞI

38 Örnek n = 25 hacimli bir şans örneğinin ortalamasıX = 50 dir. Populasyonun standart sapmasının X = 10 olduğu bilindiğine göre X için 95% ‘lik güven aralığını oluşturunuz. P( 50 - 10 10 )=0.95 1 . 96 × m 50 + 1 . 96 × 25 25 P( . 46 08 m 53 . 92 )=0.95 38

39 POPULASYONUN standart sapması bilinmiyor
Populasyonun St.Sapması X Bilinmediğinde ve n 30 Olduğunda Ortalama İçin Güven Aralığı 1. Varsayımlar: POPULASYONUN standart sapması bilinmiyor Populasyon Normal dağılımlıdır. 2. Merkezi limit teoremi kullanılarak Z Dağılımı kullanılır. 3. Güven aralığı tahmini: Örneğin st.sapması 39

40 Populasyon st.sapması bilinmediğinde ve n30 olduğunda ortalama için güven aralığı örneği
Bir ampul şirketi yeni bir ampul geliştirerek piyasaya sürüyor. Üretim bandından 100 tanesi rassal olarak seçiliyor ve bunların standart sapması 140 saat, kulanım süreleri de ortalama olarak 1280 saat bulunuyor. =0.05 için populasyon ortalamasının güven aralığını bulunuz. P( )=0.95 Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95 olasılıkla ile saat arasındadır. 40

41 Bir Oranın Güven Aralığı
1. Varsayımları İki kategorik çıktı vardır. Populasyon Binom dağılımı gösterir. 2. Güven aralığı tahmini: Özellikli birim sayısı Örnek hacmi 41

42 Bir Oranın Güven Aralığı
ÖRNEK: 400 lise öğrencisinden oluşan bir örnekte 32 öğrenci üniversite sınavını kazanmıştır. Üniversite öğrencilerinin sınavı kazanma oranı için %95’lik güven aralığını bulunuz. 42

43 İki Ortalamanın Farkı İçin Güven Aralığı
Populasyon Varyansları Biliniyorsa: Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda: 43

44 Populasyon st.sapması bilinmediğinde ve n>30 olduğunda iki ortalama farkı için güven aralığı örneği Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun başlangıcından 6 hafta sonra her iki sınıfa da aynı test uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama başarı notu 86 ve standart sapması 12, B sınıfından rassal olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama başarı notları arasındaki farkın güven aralığını %99 olasılıkla belirleyiniz. 44

45 Populasyon st.sapması bilinmediğinde ve n>30 olduğunda iki ortalama farkı için güven aralığı örneği

46 İki Oran Farkının Güven Aralığı
1. Varsayımları İki kategorik çıktı vardır. Populasyonlar Binom dağılımı gösterir. 2. Güven aralığı tahmini: İki oran farkının standart sapması 46

47 İki Oran Farkının Güven Aralığına Örnek
İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının farkının %95’lik güven aralığını bulunuz. n1 = 1000, n2 = 1000 47

48 İki Oran Farkının Güven Aralığına Örnek

49 STANDART SAPMA İÇİN GÜVEN ARALIĞI
Örnek standart sapması s,anakütle standart sapması ’nın nokta tahminidir. Nokta tahmininden hareketle anakütle standart sapmasının güven aralığı, /2 /2 1 -  s

50 Standart Sapmalar için Güven Aralığına Örnek
Bir makinada , bir hafta içersinde yapılan 200 bilyeli yatağın çapları ölçülmüş ve ortalama 2.09 cm , standart sapma ise 0.11 cm bulunmuştur. Bütün bilyeli yatakların çaplarına ait standart sapmanın güven sınırlarını bulunuz. n=200


"ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ" indir ppt

Benzer bir sunumlar


Google Reklamları