Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı
Örnek: Buca ilçesindeki kiralık evlerin aylık kira ücretlerinin ortalaması 400 YTL., standart sapması 10 YTL. olan Normal Dağılışa uygun olduğu bilinmektedir. a)Kiralık bir evin aylık kira miktarının 380 YTL. İle 410 YTL. arasında olma olasılığını hesaplayınız. b)36 kiralık evin aylık kira miktarlarının ortalamasının 395 YTL ile 402 YTL arasında olma olasılığını hesaplayınız. a) P ( 380 < X < 410 ) = ? b) P ( 395 < < 420) = ?
ÖRNEKLEME TEORİSİ İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI
Yorumlama süreci Tahminler ve testler Populasyon Örnek İstatistikleri
Örnek Tipleri Örnek Tipi Olasılık Dışı Olasılık Basit Sistematik Probability Samples Selection is based on chance Subjects are chosen based on some known probabilities Eliminates or reduces bias Random refers to procedure not the data: The outcome cannot be predicted because it is dependent upon chance Non Probability Samples Do not have above characteristics Done for time and convenience Olasılık Dışı Olasılık Basit Sistematik Tabakalı Kümeli Şans Yargı Kota Kitle 17
Niçin Örnek? Anakütle parametrelerinin örnek değerleri(örnek istatistikleri) yardımıyla tahmin edilmesine imkan sağlamak modern istatistiğin önemli bir görevidir. Anakütlenin tamamı incelenmez. Anakütleden bir şans örneği alınır. Elde edilen örnek değerlerinin anakütle parametresi yerine kullanılması için iki şart vardır: Örnek şans örneği olmalı. Anakütledeki her birimin örneğe girme şansı eşit olmalı Örnek yeterince büyük olmalı Pragmatic Reasons If Chrysler wished to census past purchasers’ reactions, millions of car buyers would have to be contacted Accurate & Reliable Results Reasonable accuracy though not perfect - sampling error! May be more accurate than census since less chance of nonsampling errors (e.g., data entry) Bureau of the Census uses samples to check the accuracy of the US Census. If the sample shows possible source of error, the census is redone. Destruction of Test Units e.g., Mean Life of Light Bulbs
İadeli örnekleme:Çekilen birimin anakütleye tekrar iade edilmesidir. İadesiz örnekleme:Çekilen birim anakütleye iade edilmez. Bir anakütleden alınan şans örneklerinin her birisi için örnek istatistikleri hesaplandığında örnekleme dağılımları ortaya çıkar: Bir örneğin ortalaması hesaplanmışsa elde edilen dağılımı ortalamaların örnekleme dağılımı, Her örnek için p oranları hesaplandığında oranların örnek dağılımı elde edilir.
İki ayrı anakütlenin karşılaştırılması yapılıyorsa farklarla ilgili örnekleme dağılımı ortaya çıkar: Her iki anakütleden alınan nA ve nB büyüklüğündeki örneklerin ortalamaları hesaplanmış ve bu ve değerleri arasındaki farklar belirlenmişse elde edilen dağılım ortalamalar arası farkların örnekleme dağılımıdır. Anakütlelerden alınan örnekler için oranlar hesaplanmış ve bu oranların anakütleler itibariyle gösterdikleri farklılıklar ortaya konulmuşsa elde edilen dağılım oranlar arası farkların örnekleme dağılımıdır.
Örnek hacmi arttıkça (n 30) ... Bir populasyon parametresini tahminlemek için şans değişkenleri kullanılır: Örnek ortalaması, örnek oranı, örnek medyanı… Merkezi Limit Teoremi Örnek hacmi arttıkça (n 30) ... Örnekleme dağılışı normal dağılıma yaklaşır.
ORTALAMALARIN ÖRNEKLEME DAĞILIMI Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi bir tahmincisidir. Her biri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden daha azdır. Standart sapma bir örneğin değişkenliği hakkında bilgi verirken , Ortalamaların örnekleme dağılımının değişkenliği standart hatayla gösterilir.
Ana kütle standart sapması bilindiğinde standart hata Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi, ortalamaların örnekleme dağılımının değişkenliğini azaltıcı bir faktördür. Ana kütle standart sapması bilindiğinde standart hata eşitliğiyle hesaplanır. Standart z değerleri formulüyle hesaplanır. Ortalamaların örnekleme dağılımında yerini alır.
Herhangi bir değerinin standart Z değerine dönüştürmesinde eşitliği kullanılır. Örnekleme dağılımı Standart normal dağılım = 1 X z = 0 Z X Z
Normal populasyondan örnekleme Populasyon dağılımı Merkezi eğilim Yayılım = 10 Örnekleme dağılımı n = 4 X = 5 n =16 X = 2.5 25
Alıştırma Türk telekomda çalışan bir operatörsünüz. Uzun mesafeli telefon görüşmeleri = 8 dk. & = 2 dk. ile normal dağılmaktadır. Eğer 25 lik örnekler seçilirse örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında olacaktır? 26
Çözüm X 7 . 8 8 Z . 50 n 2 25 X 8 . 2 8 Örnekleme dağılımı Z . 50 Standart normal dağılım n 2 25 = .4 = 1 X Z .3830 .1915 .1915 7.8 8 8.2 -.50 .50 Z 27
ORANLARIN ÖRNEKLEME DAĞILIMI Oranların örnek dağılımının ortalaması anakütle oranına eşittir. ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000 YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem dağılımının standart hatası nedir?
ORANLARIN ÖRNEKLEME DAĞILIMI Aynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini hesaplayınız. 0.1233 0.3621 -2.18 -1.09 0.4854
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir.
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası,
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir.
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:
İstatistiksel metotlar Tanımlayıcı istatistikler Yorumlayıcı istatistikler Hipotez Testi Tahminleme
Yorumlayıcı İstatistikler Aralık tahminleme ve hipotez testlerini içerir. Amacı populasyon karakteristikleri hakkında karar vermektir. Populasyon?
%95 eminim ki, , 40 ile 60 arasındadır. Tahmin süreci Populasyon Şans örneği %95 eminim ki, , 40 ile 60 arasındadır. Ortalama = 50 Ortalama, , bilinmiyor
Bilinmeyen populasyon parametreleri tahminlenir... parametresini Örnek istatistiğiyle Tahminle! Ortalama Oran P p 2 Varyans s Farklar 1 2 1 2
Tahminleyicilerin Özellikleri 1. Sapmasızlık Sapmasız Sapmalı B A N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir.
2. Tutarlılık (Kararlılık) Tahminleyicilerin Özellikleri 2. Tutarlılık (Kararlılık) Küçük örnek hacmi Büyük örnek hacmi A B Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir. ,’nın tutarlı tahmincisidir.
Tahminleyicilerin Özellikleri 3. Etkinlik Etkin Tahminci A B Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir.
İstatistiksel Tahminleme Nokta Tahmini Aralık Tahmini Populasyon parametresinin tek bir tahmin değerini verir Populasyon parametresinin tahmin aralığını verir. Nokta tahmini kullanılarak hesaplanır.
Güven Aralığı Tahmininin Elemanları Bir değer aralığı verir. Populasyon parametresine yakınlık hakkında bilgi verir. Olasılık terimleriyle ifade edilir. Güven Aralığı Tahmininin Elemanları Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı Örnek istatistiği Güven aralığı Alt güven sınırı 42 Üst güven sınırı 42