TAHMİNLEYİCİLERİN ÖZELLİKLERİ ÖRNEKLEME DAĞILIMI NOKTA TAHMİNİ VE GÜVEN ARALIKLARI İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI
İstatistiksel metotlar Tanımlayıcı istatistikler Yorumlayıcı istatistikler Hipotez Testi Tahminleme 2 2
Yorumlayıcı İstatistikler Aralık tahminleme ve hipotez testlerini içerir. Amacı populasyon karakteristikleri hakkında karar vermektir. Populasyon? 3 3
%95 eminim ki, , 40 ile 60 arasındadır. Tahmin süreci Populasyon Şans örneği %95 eminim ki, , 40 ile 60 arasındadır. Ortalama = 50 Ortalama, , bilinmiyor 4 4
Bilinmeyen populasyon parametreleri tahminlenir parametresini Örnek istatistiğiyle Tahminle! Ortalama Oran P p 2 Varyans s Farklar 1 2 1 2 5 5
Tahminleyicilerin Özellikleri 1. Sapmasızlık Sapmasız Sapmalı B A N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir.
Tahminleyicilerin Özellikleri 2. Tutarlılık (Kararlılık) Küçük örnek hacmi Büyük örnek hacmi A B Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir. ,’nın tutarlı tahmincisidir.
Tahminleyicilerin Özellikleri 3. Etkinlik Etkin Tahminci A B Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir.
ORTALAMALARIN ÖRNEKLEME DAĞILIMI Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi bir tahmincisidir. Her biri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden daha azdır. Standart sapma bir örneğin değişkenliği hakkında bilgi verirken , Ortalamaların örnekleme dağılımının değişkenliği standart hatayla gösterilir.
Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi, ortalamaların örnekleme dağılımının değişkenliğini azaltıcı bir faktördür. Ana kütle standart sapması bilindiğinde standart hata eşitliğiyle hesaplanır. Standart z değerleri formülüyle hesaplanır. Ortalamaların örnekleme dağılımında yerini alır.
Herhangi bir değerinin standart Z değerine dönüştürmesinde eşitliği kullanılır. Örnekleme dağılımı Standart normal dağılım = 1 X z = 0 Z X Z
Normal populasyondan örnekleme Populasyon dağılımı Merkezi eğilim Yayılım yerine koyarak örnekleme = 10 Örnekleme dağılımı n = 4 X = 5 n =16 X = 2.5 12
Alıştırma Türk telekomda çalışan bir operatörsünüz. Uzun mesafeli telefon görüşmeleri = 8 dk. & = 2 dk. İle normal dağılmakta. Eğer 25 aramalık örnekler seçerseniz örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında olacaktır? 13
Çözüm X 7 . 8 8 Z . 50 n 2 25 X 8 . 2 8 Örnekleme dağılımı Z . 50 Standart normal dağılım n 2 25 = .4 = 1 X Z .3830 .1915 .1915 7.8 8 8.2 -.50 .50 Z 14
ORANLARIN ÖRNEKLEME DAĞILIMI Oranların örnek dağılımının ortalaması anakütle oranına eşittir. ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000 YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem dağılımının standart hatası nedir?
ORANLARIN ÖRNEKLEME DAĞILIMI Aynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini hesaplayınız. 0.1233 0.3621 -2.18 -1.09 0.4854
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir.
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası,
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir.
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:
İstatistiksel Tahminleme Nokta Tahmini Aralık Tahmini Populasyon parametresinin tek bir tahmin değerini verir Populasyon parametresinin tahmin aralığını verir. Nokta tahmini kullanılarak hesaplanır.
Örneğin yeterince büyük olmaması veya bir örnekten elde edilen istatistiğin bir başka örnekten sağlanan istatistikle aynı olmayışı yüzünden anakütle parametresini bir noktada tahmin etmek yanlış sonuçlar doğurabilir. Bu yüzden anakütle parametresi belirli bir hata seviyesi göz önüne alınarak belirli bir aralıkta aranır. Hata terimini a ile gösterirsek, 1- a güven seviyesinde aralık tahmini yapabiliriz. Hata terimi normal eğrinin her iki ucunda eşit olarak yer alır.
Bu a/2 lik hata terimine karşılık gelen ± Z değerleri belirlenerek örnek dağılımının standart hatası ile çarpıldığında hata payı elde edilir. Hata payının örnek istatistiğine eklenip çıkarılması ile aralık tahmini yapılır. Bu şekilde, anakütle parametresinin belirli aralıkta yer aldığını, 1-a güven seviyesinde söyleyebiliriz. Güven sınırlarından küçük olanına alt güven sınırı, büyüğüne ise üst güven sınırı denir. Hata terimi küçüldükçe güven aralığı genişler. Güven sınırlarının belirleneceği olasılık seviyesine göre Z değeri değişir.
Güven Aralığı Tahmininin Elemanları Bir değer aralığı verir. Populasyon parametresine yakınlık hakkında bilgi verir. Olasılık terimleriyle ifade edilir. Güven Aralığı Tahmininin Elemanları Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı Örnek istatistiği Güven aralığı Alt güven sınırı 24 Üst güven sınırı 24
Güven Aralığı Tahminleri Güven Aralıkları Oran Varyans Ortalama bilinmiyor biliniyor n30 n<30 Z dağılımı t dağılımı 25
ORTALAMALAR İÇİN GÜVEN ARALIĞI Bir örnekden elde edilen istatistiği anakütle ortalaması m x in nokta tahminidir. Gerçek anakütle ortalaması, 1-a güven seviyesinde aralığında yer alır.
x _ Örneklerin 90% Örneklerin 95% Örneklerin 99%
Aralıklar ve güven seviyesi _ Ortalamanın örnekleme dağılımı x /2 /2 1 - _ X = x aralık Aralıkların %(1 - ) ‘ı ’yü kapsar. % ‘sı kapsamaz. Notice that the interval width is determined by 1- in the sampling distribution. Çok sayıda aralık
Güven Seviyesi Bilinmeyen populasyon parametresinin aralık içine düşme olasılığıdır. %(1 - = güven seviyesi :Parametrenin aralık içinde olmaması olasılığıdır. Tipik değerler %99, %95, %90
%95 güven sınırları belirlenirken a hatası 1-0. 95=0. 05 dir %95 güven sınırları belirlenirken a hatası 1-0.95=0.05 dir. Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında a /2 =0.05/2=0.025 dur. Bu alanları belirleyen biri negatif, diğeri pozitif iki Z değeri vardır. Normal eğri alanları tablosunda 0.50-0.025=0.4750 değerini gösteren Z= ±1.96 değerleri aradığımız Z değerleridir.
%99 güven sınırları belirlenirken a hatası 1-0.99=0.01 dir. Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında a/2=0.01/2=0.005 bulunur. Normal eğri alanları tablosunda 0.5-0.005=0.4950 değerini gösteren Z= ±2.58 değerleri aradığımız Z değerleridir.
Aralık genişliğini etkileyen faktörler Verilerin yayılımı () Örnek hacmi Güven seviyesi (1 - ) Have students explain why each of these occurs. Level of confidence can be seen in the sampling distribution.
Örnek: Bir fabrikada üretilen 100 ürünün ortalama ağırlığı 1040 gr standart sapması 25 gr bulunmuştur. Bu imalat prosesinde üretilen ürünlerin ortalama ağırlığı %95 güvenle hangi aralıktadır? %95 için z değeri ± 1.96 0.475 /2=0.05/2=0.025 z=-1.96 = 0 z=1.96 Z
Popülasyonun standart sapması bilinmiyor Populasyon normal dağılımlı. Populasyonun standart sapması X bilinmediğinde ve n 30 olduğunda ortalama için güven aralığı 1. Varsayımlar: Popülasyonun standart sapması bilinmiyor Populasyon normal dağılımlı. 2. Merkezi limit teoremi kullanılarak Z Dağılımı kullanılır. 3. Güven aralığı tahmini: Örneğin standart sapması 35
Örnek Bir ampul şirketi yeni bir ampul geliştirerek piyasaya sürüyor. Üretim bandından 100 tanesi rassal olarak seçiliyor ve bunların standart sapması 140 saat, kulanım süreleri de ortalama olarak 1280 saat bulunuyor. =0.05 için populasyon ortalamasının güven aralığını bulunuz. P( )=0.95 Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95 olasılıkla 1252.56 ile 1307.44 saat arasındadır. 36
Bir Oranın Güven Aralığı Örnek oranı p anakütle oranı P nin nokta tahminidir. 1. Varsayımları İki kategorik çıktı vardır. Populasyon binom dağılımı gösterir. 2. Güven aralığı tahmini: Özellikli birim sayısı Örnek hacmi 37 37
ÖRNEK: 400 lise öğrencisinden oluşan bir örnekte 32 öğrenci üniversite sınavını kazanmıştır. Üniversite öğrencilerinin sınavı kazanma oranı için %95’lik güven aralığını bulunuz. 38 38
İki Ortalamanın Farkı İçin Güven Aralığı Örnek ortalamalarından büyük olan ile gösterilirse örnek ortalamaları arasındaki farktan hareketle anakütle ortalamaları arasındaki farkın güven sınırları aşağıdaki gibi olur. Populasyon Varyansları Biliniyorsa: Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda: 39
Örnek Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun başlangıcından 6 hafta sonra her iki sınıfa da aynı test uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama başarı notu 86 ve standart sapması 12, B sınıfından rassal olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama başarı notları arasındaki farkın güven aralığını %99 olasılıkla belirleyiniz. 40 40
Örnek 41
Ortalamalar arası Farkların Güven Aralığı (Varyansların Eşit Olması) İstanbul’daki üniversite öğrencilerinden rastsal olarak seçilen bir grup öğrenci ile Ankara’daki üniversite öğrencilerinden rastsal olarak seçilen bir grup öğrencinin aylık harcamaları TL olarak aşağıdaki gibidir: İstanbul X1 25 40 30 50 60 45 Ankara X2 20 15 35 İki örneğin ortalaması sırasıyla 40 ve 30TL ve varyansları da 144 ve 121 olarak bulunmuştur. Anakütle varyanslarının bilinmediği ve eşit olduğu varyasımı altında iki ildeki öğrencilerin aylık harcamalarının farkının %95 güven aralığını hesaplayınız.
Ortalamalar arası Farkların Güven Aralığı (Varyansların Eşit Olması)
Ortalamalar arası Farkların Güven Aralığı (Varyansların Eşit Olması)
İki Oran Farkının Güven Aralığı 1. Varsayımları İki kategorik çıktı vardır. Populasyonlar binom dağılımı gösterir. 2. Güven aralığı tahmini: Örnek oranlarından büyük olan p1 ile gösterilirse örnek oranları arasındaki farktan hareketle anakütle oranları arasındaki farkın güven sınırları aşağıdaki gibi olur. İki oran farkının standart sapması 45 45
İki Oran Farkının Güven Aralığına Örnek İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının farkının %95’lik güven aralığını bulunuz. n1 = 1000, n2 = 1000 46 46
47
Student t Dağılımı Küçük örneklerden (n<30) elde edilen istatistiklerin dağılımı Student t dağılımına uyar. Küçük örnek istatistiklerinin gösterdiği dağılım normal eğri gibi simetriktir.Normal eğriye göre daha basık ve yaygın bir şekil alır. Böylece eğrinin kuyruklarında daha büyük bir alan oluşur. Küçük örnekler için z cetveli yerine,çeşitli örnek büyüklükleri ve olasılık seviyeleri için ayrı ayrı hesaplanmış t cetvelleri kullanılır.
z t Çan şekilli simetrik, ‘Tombul’ kuyruklar Standart Normal t (sd = 13) t (sd = 5) z t
Student t Tablosu .05 2 t .05 2.920 t değerleri Üst kuyruk alanı sd n = 3 sd = n - 1 = 2 = .10 /2 =.05 Olsun: Üst kuyruk alanı sd .25 .10 .05 1 1.000 3.078 6.314 Confidence intervals use /2, so divide ! 2 0.817 1.886 2.920 .05 3 0.765 1.638 2.353 t 2.920 t değerleri
Populasyonun standart sapması X bilinmediğinde ve n< 30 olduğunda ortalama için güven aralığı 1. Varsayımlar: Popülasyonun standart sapması bilinmiyor Populasyon normal dağılımlıdır. 2. Student’ın t Dağılımı kullanılır. 3. Güven aralığı tahmini: Örneğin standart sapması
ORTALAMA İÇİN GÜVEN ARALIĞI Populasyonun standart sapması X bilinmediğinde ve populasyonun normal dağıldığı varsayımı altında güven aralığı tahmini: /2 /2 1 - s
ÖRNEK Bir fabrikada rasgele üretilen 25 ürünün ortalama ağırlığı 1040 gr standart sapması 25 gr bulunmuştur. %95 güvenle bu imalat prosesinde üretilen ürünlerin ortalama ağırlığı hangi aralıkta yer alır?
Ortalamalar arası Farkların Güven Aralığı İki anakütleden tesadüfi olarak seçilen ve hacimlerindeki iki küçük örnekten hareketle anakütle ortalamaları arasındaki farkın güven sınırları belirlenebilir. Birinci örneğin serbestlik derecesi n1 -1 ve ikinci örneğin serbestlik derecesi n2 – 1 dir ve toplam serbestli derecesi olur. Anakütle ortalamaları arasındaki farkın güven aralığı belirlenirken serbestlik derecesine ve hata payına göre t tablo değerleri bulunur.
ÖRNEK 13 deneme sonrasında bir benzin pompası ortalama 125 ml fazla benzin ölçümü yaparken standart sapma 17 ml olmuştur.Bir başka benzin pompası ise 10 deneme sonrasında deneme başına ortalama 110 ml fazla benzin ölçümü yapılmış ve standart sapması 19 ml bulunmuştur. Anakütle ortalamaları arasındaki farkın %99 güven sınırlarını bulunuz. Pompaların fazla ölçümleri arasındaki fark %99 güvenle -7.68 ml ile 37.68 ml arasındadır.
Eşleştirilmiş Örnek t Testi Aynı veya benzer denekler üzerinde birbirinden farklı iki işlemin uygulanması sonucu elde edilen verilere eşleştirilmiş örnekler denir. 1. İki ilişkili populasyonun ortalamasını test eder. Çift ya da eşleştirilmiş Tekrarlı gözlemler (önce/sonra) 2. Nesneler arasındaki varyasyonu ortadan kaldırır. Varsayımları İki populasyon da normal dağılımlıdır. Eğer normal değilse normale yaklaşmaktadır. (n1 30 & n2 30 )
Eşleştirilmiş Örnek t Testi İki komisyoncunun aynı evlere farklı fiyatlar verdiği iddia edilmektedir. İddiayı test etmek için 12 ev seçiliyor ve komisyonculardan bu evlere 1000$ bazında fiyat vermeleri isteniyor. Elde edilen sonuçlar aşağıdaki gibidir.İki komisyoncunun fiyat ortalamaları arasındaki farka ilişkin güven aralığını hesaplayınız. Komisyoncular Evler A B D D2 1 181.0 182.0 -1.0 1.00 2 179.9 180.0 -0.1 0.01 3 163.0 161.5 1.5 2.25 4 218.0 215.0 3.0 9.00 5 213.0 216.5 -3.5 12.25 6 175.0 0.0 0.00 7 217.9 219.5 -1.6 2.56 8 151.0 150.0 1.0 9 164.9 165.5 -0.6 0.36 10 192.5 195.0 -2.5 6.25 11 225.0 222.7 2.3 5.29 12 177.5 178.0 -0.5 0.25 Toplam -2.0 40.22
ttab : t11,0.05 = ± 2.201
BİR POPULASYON VARYANSI İÇİN GÜVEN ARALIKLARI Bir anakütle varyansı için de güven aralığı bulmak gerekir. Bu tahminler örneklem varyansına dayanır. Varyansı olan bir normal anakütleden n gözlemli rassal bir örneklem seçilsin. Örneklem varyansı da s2 ile gösterilsin. Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına uymaktadır. Bu bulgu, normal bir dağılımdan örneklem alındığında anakütle varyansı için güven aralıklarının türetilmesinin temelini oluşturur.
Örneklem varyansının gözlenen belli değeri ise, anakütle varyansının güven aralığı aşağıdaki gibidir: Örneğin a=0.05 n=10 olsun 1-a
Örnek Bir çimento fabrikasında üretilen çimentodan yapılan betonların sağlamlığının incelenmesi amacıyla 10 beton örneği alınmış ve bu örneklerin sağlamlılıkları saptanmıştır. Bu örneklerin ortalama ve varyansı olarak bulunmuştur. Fabrikanın ürettiği tüm betonların varyansına ilişkin güven aralığını hesaplayınız. a=0.10
ÖRNEK Denenen bir motorun 16 deneme sürüşündeki yakıt tüketimlerinin standart sapması 2.2 golondur. Motorun yakıt tüketiminin gerçek değişkenliğini ölçen anakütle varyansının % 99 güven aralığını hesaplayınız. n=16 s=2.2
n=16 S=2.2
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Normal dağılımlı iki populasyonun varyanslarının oranı F dağılımına uymaktadır. F dağılışı simetrik olmayan bir dağılıştır. Bu nedenle güven aralığının hesaplanmasında her iki F değeri için F tablosuna bakmak gerekmektedir. 65
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Normal dağılımlı iki populasyonun varyanslarının oranına ilişkin güven aralığı : F 67
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Aşağıda verilen bilgiler yardımıyla pazara sunulan iki ayrı bağımsız hisse senedinin değişkenliklerinin oranına ilişkin çift yönlü güven aralığını bulunuz.
ÖRNEK Pazara yeni sürülmüş on yedi AAA dereceli sınai tahvilden oluşan rassal bir örneklemde vadelerin varyansı 123.35’dir. Onbir yeni CCC dereceli sınai tahvilden oluşan bağımsız bir rassal örneklemde vadelerin varyansı 8.02’dir. Bu iki tahvilin değişkenliklerinin %90 güven aralığını bulunuz. n1=17 s12=123.35 s22=8.02 n1-1=16 n2-1=10 sd. n2=11