ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ

Slides:



Advertisements
Benzer bir sunumlar
Çıkarımsal İstatistik
Advertisements

Kütle varyansı için hipotez testi
GİRİŞ BÖLÜM:1-2 VERİ ANALİZİ YL.
İki kütle ortalamasının farkının güven aralığı
Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi
İSTATİSTİK VE OLASILIK I
İstatistik Tahmin ve Güven aralıkları
Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ
VARYANS ANALİZİ İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden.
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
ANOVA.
HİPOTEZ TESTLERİ.
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
Tanımlayıcı İstatistikler
HİPOTEZ TESTLERİ.
HİPOTEZ TESTLERİ.
Normal Dağılım.
TAHMİNLEYİCİLERİN ÖZELLİKLERİ ÖRNEKLEME DAĞILIMI
Büyük ve Küçük Örneklemlerden Kestirme
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını.
ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ
SÜREKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK YOĞUNLUK FONKSİYONLARI
OLASILIK ve KURAMSAL DAĞILIMLAR
İki Ortalama Farkının Test Edilmesi
Merkezi Eğilim (Yer) Ölçüleri
KESİKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK DAĞILIMLARI
Kİ-KARE DAĞILIMI VE TESTİ
ÖRNEKLEME DAĞILIMI NOKTA TAHMİNİ VE GÜVEN ARALIKLARI
DEĞİŞKENLİK ÖLÇÜLERİ.
SÜREKLİ ŞANS DEĞİŞKENLERİ
ÖRNEKLEME DAĞILIMI NOKTA TAHMİNİ VE GÜVEN ARALIKLARI
Uygulama I.
Örneklem Dağılışları.
Asimetri ve Basıklık Ölçüleri
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Bilişim Teknolojileri için İşletme İstatistiği
Bölüm 07 Sürekli Olasılık Dağılımları
Uygulama 3.
Kesikli ve Sürekli Dağılımlar
İletişim Fakültesi Bilişim A.B.D.
Örneklem Dağılışları ve Standart Hata
Asimetri ve Basıklık Ölçüleri
İSTATİSTİK YGULAMALARI: SINAVA HAZIRLIK
KESİKLİ RASSAL DEĞİŞKENLER
Güven Aralığı.
İstatistik Tahmin ve Güven aralıkları
İSTATİSTİKTE TAHMİN ve HİPOTEZ TESTLERİ İSTATİSTİK
İSTATİSTİK II Hipotez Testleri 3.
1 İ STATİSTİK II Tahminler ve Güven Aralıkları - 1.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
Rastgele Değişkenlerin Dağılımları
İSTATİSTİK II Örnekleme Dağılışları & Tahminleyicilerin Özellikleri.
OLASILIK ve İSTATİSTİK
Teorik Dağılımlar: Diğer Dağılımlar
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Merkezi Eğilim Ölçüleri
DEĞİŞKENLİK ÖLÇÜLERİ.
HİPOTEZ TESTLERİ.
Temel İstatistik Terimler
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
Uygulama I.
Tıp Fakültesi UYGULAMA 2
HİPOTEZ TESTLERİ.
OLASILIK DAĞILIMLARI Bu kısımda teorik olasılık dağılımları incelenecektir. Gerçek hayatta birçok olayın dağılımı bu kısımda inceleyeceğimiz çeşitli olasılık.
Temel İstatistik Terimler
Yrd.Doç.Dr.İstem Köymen KESER
Sunum transkripti:

ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ

TEMEL KAVRAMLAR PARAMETRE: Populasyonun sayısal açıklayıcı bir ölçüsüdür ve anakütledeki tüm elemanlar dikkate alınarak hesaplanabilir. Anakütledeki tek bir eleman dahi işlemin dışında kalır ise elde edilen sonuç parametre olarak kabul edilemez. ÖRNEK İSTATİSTİĞİ (PARAMETRE TAHMİNLEYİCİSİ): Bir örneğin sayısal betimsel ölçüsüdür ve örnekteki gözlemlerden hesaplanır. Diğer bir deyişle bilinmeyen bir parametrenin sayısal değerini bulabilmek (tahminlemek) için kullanılır.

PARAMETRE VE ÖRNEK İSTATİSTİKLERİ İÇİN ÖRNEKLER Anakütle ortalaması  Anakütle Medyanı M Anakütle Varyansı 2 Anakütle Standart Sapması  Anakütle Oranı P Örnek istatistiği Örnek ortalaması Örnek Medyanı m Örnek Varyansı s2 Örnek Standart Sapması s Örnek Oranı p

Bir Populasyon Parametresi Hakkında En Geniş Bilgiyi Hangi Örnek İstatistiğinin İçerdiğine Nasıl Karar Verilecek? Örneğin anakütle ortalaması  için Aritmetik ortalama Geometrik ortalama Harmonik ortalama Medyan vb. örnek istatistiklerinden hangisi tercih edilmelidir.

Örnek 1a x 1 2 3 4 5 6 P(x) 1/6 xP(x) 2/6 3/6 4/6 5/6 6/6 Bir zar atılışında x üst yüzdeki sayıyı göstersin. E(x)= anakütle parametresini (anakütle ortalamasını) bulunuz. x 1 2 3 4 5 6 P(x) 1/6 xP(x) 2/6 3/6 4/6 5/6 6/6

Örnek 1b Ancak bu  değerinin bir an için bilinmediği ve bunu tahmin etmek için populasyondan 3 örnek alındığını varsayılsın.

Zar 3 kez atılsın ve örnek sonuçları; x1=2, x2=2, x3=6 elde edilsin. ve m=2 hesaplanabilir. m:medyan SONUÇ: değeri  değerine daha yakındır.

Zar 3 kez daha atılsın ve örnek sonuçları; x1=3, x2=4, x3=6 elde edilsin. ve m=4 SONUÇ: m değeri  değerine daha yakındır.

Örnek için Yorum Örnekten hesaplanan örnek istatistikleri (tahminleyiciler) birer şans değişkenidir. Ne örnek aritmetik ortalaması Ne de örnek medyanı (m), populasyon ortalamasına daima daha yakındır denilemez. Sonuçların genellenebilmesi için örnek istatistiklerinin dağılışına gerek duyulmaktadır.

ÖRNEKLEME DAĞILIMLARI Anakütleden n adet ölçümden x1, …, xn oluşan bir örnekten alınmış olsun. Anakütledeki eleman sayısı N olsun. Anakütleden alınabilecek her biri n adet eleman içeren tüm mümkün örnek sayısı:

ÖRNEKLEME DAĞILIMLARI Bu koşullar (N, n) altında hesaplanabilecek örnek istatistiği sayısı k adettir. Örnek istatistiğinin anakütlesindeki eleman sayısı k olur. Örnek verilerinden hesaplanan bir örnek istatistiği için elde edilen bu anakütle örnekleme dağılışı olarak adlandırılır.

ÖRNEKLEME DAĞILIMLARI Örnekleme dağılımı bu istatistiğin bir olasılık dağılışıdır. Örnekleme dağılımı anakütledeki eleman sayısı N ve n örnek hacminin bir fonksiyonudur.

Örnek 2 Büyük bir populasyondan alınmış 3 ölçümün (0, 3, 12) olasılık dağılışı aşağıdaki gibidir; n = 3 Örnek ortalaması ( )’nın örnekleme dağılışı Örnek medyanı (m)’nın örnekleme dağılışını bulunuz. DİKKAT: ANAKÜTLEDEKİ ELEMAN SAYISI N BİLİNMİYOR. FAKAT ŞANS DEĞİŞKENİNİN OLASILIK DAĞILIMI P(x) BİLİNİYOR. x 3 12 P(x) 1/3

Örnek 2 Örnek 3

Örnek 2 Aritmetik Ortalama Örnekleme Dağılışı Medyan Örnekleme Dağılışı 1 2 3 4 5 6 8 9 12 P( ) 1/27 3/27 6/27 m 3 12 P(m) 7/27 13/27

Niçin Örnek? Anakütle parametrelerinin örnek değerleri (örnek istatistikleri) yardımıyla tahmin edilmesine imkan sağlamak modern istatistiğin önemli bir görevidir. Anakütlenin tamamı incelenmez. Anakütleden bir şans örneği alınır. Elde edilen örnek değerlerinin anakütle parametresi yerine kullanılması için iki şart vardır: Örnek şans örneği olmalı. Anakütledeki her birimin örneğe girme şansı eşit olmalı Örnek yeterince büyük olmalı Pragmatic Reasons If Chrysler wished to census past purchasers’ reactions, millions of car buyers would have to be contacted Accurate & Reliable Results Reasonable accuracy though not perfect - sampling error! May be more accurate than census since less chance of nonsampling errors (e.g., data entry) Bureau of the Census uses samples to check the accuracy of the US Census. If the sample shows possible source of error, the census is redone. Destruction of Test Units e.g., Mean Life of Light Bulbs

Tahminleyicilerin Özellikleri 1. Sapmasızlık  Sapmasız Sapmalı  B A N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir.

Tahminleyicilerin Özellikleri Tutarlılık (Kararlılık)  Küçük örnek hacmi Büyük örnek hacmi A B Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir. ,’nın tutarlı tahmincisidir.

Tahminleyicilerin Özellikleri Etkinlik Etkin Tahminci A B  Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir.

Örnek hacmi büyüdükçe tahminleyicinin varyansı küçülür. ÖRNEKLEME DAĞILIMI ÖRNEK HACMİNİN BİR FONKSİYONUDUR Örnek hacmi büyüdükçe tahminleyicinin varyansı küçülür. Büyük örnek hacimli durum Küçük örnek hacimli durum 

Örnek 3 Örnek 2 verileri için aritmetik ortalama ve örnek medyanının tahminleyici özelliklerini araştırınız.

Örnek 3 Aritmetik ortalama , anakütle ortalamasının  sapmasız bir tahminleyicisi midir? x 3 12 P(x) 1/3

Örnek 3 1 2 3 4 5 6 8 9 12 P( ) 1/27 3/27 6/27

Örnek 3 Sonuç: olduğundan aritmetik ortalama (tahminleyici), anakütle ortalamasının (parametrenin) sapmasız bir tahminleyicisidir.

Örnek 3 Örnek medyanı m, anakütle ortalamasının  sapmasız bir tahminleyicisi midir? m 3 12 P(m) 7/27 13/27

Örnek 3 Sonuç: olduğundan örnek medyanı (tahminleyici), anakütle ortalamasının (parametrenin) sapmalı bir tahminleyicisidir.

Örnek 3 Aritmetik ortalama , anakütle ortalamasının  Minimum Varyanslı bir tahminleyicisi midir? x 3 12 P(x) 1/3 x2 9 144 x2P(x) 9/3 144/3

Örnek 3 Aritmetik ortalamanın varyansı = 8,66 P( ) 1 2 3 4 5 6 8 9 12 1 2 3 4 5 6 8 9 12 P( ) 1/27 3/27 6/27 16 25 36 64 81 144 12/27 9/27 48/27 150/27 108/27 192/27 243/27 144/27 = 8,66

Örnek 3 Örnek medyanının varyansı =20.86 mi 3 12 P(mi) 7/27 13/27 9 3 12 P(mi) 7/27 13/27 9 144 117/27 1008/27 =20.86

Örnek 3 Sonuç: Aritmetik ortalama , anakütle ortalamasının  Sapmasız ve Minimum Varyanslı bir tahminleyicisidir.

BEKLENEN DEĞER VE VARYANS OPERATÖRLERİNİN ÖZELLİKLERİ BEKLENEN DEĞER OPERATÖRÜ E(.) Şans değişkeni x anakütle ortalaması  ve anakütle varyansı 2 olsun. a ile b birer sabit sayı olmak üzere, E(a)=a E(ax)=aE(x)=a E(ax+b)=aE(x)+b=a+b

BEKLENEN DEĞER VE VARYANS OPERATÖRLERİNİN ÖZELLİKLERİ VARYANS OPERATÖRÜ V(.) Şans değişkeni x anakütle ortalaması  ve anakütle varyansı 2 olsun. a ile b birer sabit sayı olmak üzere, V(a)=0 V(ax)=a2V(x)= a22 V(ax+b)= a2V(x)= a22

MERKEZİ LİMİT TEOREMİ Şans değişkeni x’in dağılımı ne olursa olsun bu anakütleden alınan n hacimli örneklerden hesaplanan aritmetik ortalamanın dağılımı yaklaşık olarak normal dağılıma sahiptir. Örnek hacmi büyüdükçe aritmetik ortalamanın dağılımının normal dağılıma yakınsaması artar.

Şans Değişkenlerinin Standartlaştırılması Standart değişkenler genellikle z ile gösterilir. Ortalaması sıfır, E(z)=0 Varyansı bir, V(Z)=1.

BAZI ÖNEMLİ TAHMİNLEYİCİLER İÇİN ÖRNEKLEME DAĞILIMLARININ BELİRLENMESİ Aritmetik ortalama Örnek varyansı s2 Örnek oranı p

BİR DAĞILIMIN BELİRLENMESİ Dağılışın tipinin belirlenmesi, (Normal, Üstel, Poisson vb.) Dağılımın parametrelerinin belirlenmesi

ARİTMETİK ORTALAMA İÇİN ÖRNEKLEME DAĞILIMI Şans değişkeni x anakütle ortalaması  ve anakütle varyansı 2 olsun. Cevaplanması gereken sorular Dağılımın tipi? Parametreleri;

Normal dağılımın parametreleri: DAĞILIMIN TİPİ Merkezi limit teoremine göre aritmetik ortalamanın dağılımı yaklaşık olarak normal dağılıma sahiptir. Normal dağılımın parametreleri: Anakütle ortalaması Anakütle varyansı

Dağılımın Parametreleri: Aritmetik Ortalama için Anakütle Ortalaması

Dağılımın Parametreleri: Aritmetik Ortalama için Anakütle Varyansı

ARİTMETİK ORTALAMA İÇİN ÖRNEKLEME DAĞILIMI

Aritmetik Ortalamanın Standartlaştırılması

Normal populasyondan örnekleme Populasyon dağılımı Merkezi eğilim Yayılım yerine koyarak örnekleme   = 10 Örnekleme dağılımı n = 4 X = 5 n =16 X = 2.5 43

Merkezi Limit Teoremi Örnekleme dağılışı hemen hemen normal olur. Örnek hacmi yeterince büyükse (n  30) ... Örnekleme dağılışı hemen hemen normal olur.

Alıştırma Türk Telekom’da çalışan bir operatörsünüz. Uzun mesafeli telefon görüşmeleri  = 8 dk. &  = 2 dk. ile normal dağılmaktadır. Eğer 25’lik örnekler seçerseniz örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında olacaktır? 45

Çözüm X   7 . 8  8 Z     . 50  n 2 25 X   8 . 2  8 Örnekleme dağılımı Z    . 50 Standart normal dağılım  n 2 25  = .4  = 1  X Z .3830 .1915 .1915 7.8 8 8.2 -.50 .50 Z  46

ÖRNEK ORANI: p Anakütle başarı olasılığını “P” ’yi tahminlemek amacıyla populasyondan alınan örnekten elde edilen bilgiler doğrultusunda örnek oranı p hesaplanır. İlgilenilen başarı olasılığının P’nin bilinmediği durumlarda n hacimlik örnek alındığında ve x örnekteki başarı sayısı olarak ele alındığında, örnekten elde edilen başarı olasılığı (örnek oranı);

ÖRNEK ORANI p İÇİN ÖRNEKLEME DAĞILIMI Şans değişkeni x sabit n hacimli denemede ortaya çıkan başarı sayısı olsun. Örnek oranı: Cevaplanması gereken sorular Dağılımın tipi? Parametreleri;

DAĞILIMIN TİPİ Merkezi limit teoremine göre örnek oranının dağılımı eğer n örnek hacmi yeterince büyük ise yaklaşık olarak normal dağılıma sahiptir. Bunun temel sebebi örnek oranının, n adet denemede ortaya çıkan ortalama başarı sayısını temsil etmesidir. Normal dağılımın parametreleri: Anakütle ortalaması Anakütle varyansı

Dağılımın Parametreleri: Örnek Oranı için Anakütle Ortalaması E(x)=nP Not: x şans değişkeni binom dağılımına sahip olduğundan: E(x)=nP

Dağılımın Parametreleri: Örnek Oranı için Anakütle Varyansı V(x)=nP(1-P) Not: x şans değişkeni binom dağılımına sahip olduğundan: V(x)=nP(1-P)

ÖRNEK ORANI p İÇİN ÖRNEKLEME DAĞILIMI

Örnek Oranının Standartlaştırılması

Örnek Hacminin Örnek Oranı Üzerindeki Etkisi Anakütle oranı P sabitken örnek hacmi arttığında örnek oranının standart hatası küçülür. Aşağıdaki şekilde görüldüğü gibi örnek hacmi arttığında p’in kendi ortalaması etrafında yoğunlaştığı görülmektedir. p

Örnek 4 Büyük bir populasyondan alınan 3 ölçüm ile ilgili örneğe dönersek x başarı sayısının örnekte tek sayı gelme olayını göstermek üzere örnek oranının beklenen değerini ve varyansını bularak dağılımını elde ediniz. pi 0/3 1/3 2/3 3/3 0/9 1/9 4/9 9/9 P(pi) 8/27 12/27 6/27 1/27

Örnek 4 I. YÖNTEM II. YÖNTEM

Örnek 5 Gelirler Genel Müdürlüğü’ne göre, bütün vergi beyannamelerinin % 75’i vergi iadesine yol açmaktadır. 100 beyannamelik bir rassal örneklem alınmıştır. Vergi iadesine yol açan beyannamelerin örneklem oranının ortalaması kaçtır? Örneklem oranının varyansı kaçtır? Örneklem oranının standart hatası kaçtır? Örneklem oranının 0,8’den büyük olma olasılığı kaçtır?

Örnek 5 Çözüm: a) b) c) Standart Sapma (ya da Standart Hata)

Örnek 5 d)

= Ki-Kare Dağılışı 2 2 = anakütle varyansı (n - 1) s 2 n = örnek miktarı s 2 = örnek varyansı 2 = anakütle varyansı df = serbestlik derecesi = n – 1=v One place where students tend to make errors with this formula is switching the values for s and . Careful reading of the problem should eliminate this difficulty. page 343 of text

Ki-Kare Dağılışı Ki-kare dağılımının tek bir parametresi vardır: v Bu parametre genel olarak serbestlik derecesi olarak adlandırılır. şeklinde gösterilir. Ki-kare dağılımı normal (standart normal) dağılıma sahip şans değişkenlerinden elde edilir.

Ki-Kare Dağılışı Şans değişkenleri xi‘ler normal dağılıma sahip olmak üzere, örnek varyansı: Eşitliğin her iki tarafı anakütle varyansına bölünerek

Ki-Kare Dağılışı Ki-kare şans değişkeninin beklenen değeri: Ki-kare şans değişkeninin varyansı:

Ki-kare istatistiğinin dağılışının özellikleri ki-kare dağılışı simetrik değildir Serbestlik derecesi arttıkça, dağılış daha simetrik hale gelir (normale yaklaşır). df = 10 Simetrik değil df = 20 Different degrees of freedom produce different chi-square distributions. x2 5 10 15 20 25 30 35 40 45 Tüm değerler sıfır veya pozitif

ÖRNEK VARYANSININ ÖRNEKLEME DAĞILIMI

ÖRNEK VARYANSININ ÖRNEKLEME DAĞILIMI

ÖRNEK VARYANSININ ÖRNEKLEME DAĞILIMI

ÖRNEK VARYANSININ ÖRNEKLEME DAĞILIMI

ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir.

ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası,

ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir.

ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:

İstatistiksel Tahminleme Nokta Tahmini Aralık Tahmini Populasyon parametresinin tek bir tahmin değerini verir Populasyon parametresinin tahmin aralığını verir. Nokta tahmini kullanılarak hesaplanır.

Örneğin yeterince büyük olmaması veya bir örnekten elde edilen istatistiğin bir başka örnekten sağlanan istatistikle aynı olmayışı yüzünden anakütle parametresini bir noktada tahmin etmek yanlış sonuçlar doğurabilir. Bu yüzden anakütle parametresi belirli bir hata seviyesi göz önüne alınarak belirli bir aralıkta aranır. Hata terimini a ile gösterirsek, 1- a güven seviyesinde aralık tahmini yapabiliriz. Hata terimi normal eğrinin her iki ucunda eşit olarak yer alır.

Bu a/2 lik hata terimine karşılık gelen ± Z değerleri belirlenerek örnek dağılımının standart hatası ile çarpıldığında hata payı elde edilir. Hata payının örnek istatistiğine eklenip çıkarılması ile aralık tahmini yapılır. Bu şekilde, anakütle parametresinin belirli aralıkta yer aldığını, 1-a güven seviyesinde söyleyebiliriz. Güven sınırlarından küçük olanına alt güven sınırı, büyüğüne ise üst güven sınırı denir. Hata terimi küçüldükçe güven aralığı genişler. Güven sınırlarının belirleneceği olasılık seviyesine göre Z değeri değişir.

Güven Aralığı Tahmininin Elemanları Bir değer aralığı verir. Populasyon parametresine yakınlık hakkında bilgi verir. Olasılık terimleriyle ifade edilir. Güven Aralığı Tahmininin Elemanları Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı Örnek istatistiği Güven aralığı Alt güven sınırı 76 Üst güven sınırı 76

Güven Aralığı Tahminleri Güven Aralıkları Oran Varyans Ortalama  bilinmiyor biliniyor n30 n<30 Z dağılımı t dağılımı 77

ORTALAMALAR İÇİN GÜVEN ARALIĞI Bir örnekden elde edilen istatistiği anakütle ortalaması m x in nokta tahminidir. Gerçek anakütle ortalaması, 1-a güven seviyesinde aralığında yer alır.

Güven aralığı  x _ Örneklerin 90% Örneklerin 95% Örneklerin 99%

Aralıklar ve güven seviyesi _ Ortalamanın örnekleme dağılımı  x  /2  /2 1 -  _ X  =   x aralık Aralıkların %(1 - ) ‘ı ’yü kapsar. % ‘sı kapsamaz. Notice that the interval width is determined by 1- in the sampling distribution. Çok sayıda aralık

Güven Seviyesi Bilinmeyen populasyon parametresinin aralık içine düşme olasılığıdır. %(1 - = güven seviyesi :Parametrenin aralık içinde olmaması olasılığıdır. Tipik değerler %99, %95, %90

%95 güven sınırları belirlenirken a hatası 1-0. 95=0. 05 dir %95 güven sınırları belirlenirken a hatası 1-0.95=0.05 dir. Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında a /2 =0.05/2=0.025 dur. Bu alanları belirleyen biri negatif, diğeri pozitif iki Z değeri vardır. Normal eğri alanları tablosunda 0.50-0.025=0.4750 değerini gösteren Z= ±1.96 değerleri aradığımız Z değerleridir.

%99 güven sınırları belirlenirken a hatası 1-0.99=0.01 dir. Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında a/2=0.01/2=0.005 bulunur. Normal eğri alanları tablosunda 0.5-0.005=0.4950 değerini gösteren Z= ±2.58 değerleri aradığımız Z değerleridir.

Aralık genişliğini etkileyen faktörler Verilerin yayılımı () Örnek hacmi Güven seviyesi (1 - ) Have students explain why each of these occurs. Level of confidence can be seen in the sampling distribution.

Örnek: Bir fabrikada üretilen 100 ürünün ortalama ağırlığı 1040 gr standart sapması 25 gr bulunmuştur. Bu imalat prosesinde üretilen ürünlerin ortalama ağırlığı %95 güvenle hangi aralıktadır? %95 için z değeri ± 1.96 0.475 /2=0.05/2=0.025 z=-1.96  = 0 z=1.96 Z

Örnek n = 25 hacimli bir şans örneğinin ortalamasıX = 50 dir. Populasyonun standart sapmasının X = 10 olduğu bilindiğine göre X için 95%’lik güven aralığını oluşturunuz. 10 10 P( )=0.95 50 - 1 . 96 × £ m £ 50 + 1 . 96 × 25 25 P( . m 46 08 £ £ 53 . 92 )=0.95 87

Popülasyonun standart sapması bilinmiyor Populasyon normal dağılımlı. Populasyonun standart sapması X bilinmediğinde ve n 30 olduğunda ortalama için güven aralığı 1. Varsayımlar: Popülasyonun standart sapması bilinmiyor Populasyon normal dağılımlı. 2. Merkezi limit teoremi kullanılarak Z Dağılımı kullanılır. 3. Güven aralığı tahmini: Örneğin standart sapması 88

Örnek Bir ampul şirketi yeni bir ampul geliştirerek piyasaya sürüyor. Üretim bandından 100 tanesi rassal olarak seçiliyor ve bunların standart sapması 140 saat, kulanım süreleri de ortalama olarak 1280 saat bulunuyor. =0.05 için populasyon ortalamasının güven aralığını bulunuz. P( )=0.95 Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95 olasılıkla 1252.56 ile 1307.44 saat arasındadır. 89

Student t Dağılımı Küçük örneklerden (n<30) elde edilen istatistiklerin dağılımı Student t dağılımına uyar. Küçük örnek istatistiklerinin gösterdiği dağılım normal eğri gibi simetriktir.Normal eğriye göre daha basık ve yaygın bir şekil alır. Böylece eğrinin kuyruklarında daha büyük bir alan oluşur. Küçük örnekler için z cetveli yerine,çeşitli örnek büyüklükleri ve olasılık seviyeleri için ayrı ayrı hesaplanmış t cetvelleri kullanılır.

z t Çan şekilli simetrik, ‘Tombul’ kuyruklar Standart Normal t (sd = 13) t (sd = 5) z t

Student t Tablosu .05 2 t .05 2.920 t değerleri Üst kuyruk alanı sd n = 3 sd = n - 1 = 2  = .10 /2 =.05 Olsun: Üst kuyruk alanı sd .25 .10 .05 1 1.000 3.078 6.314 Confidence intervals use /2, so divide ! 2 0.817 1.886 2.920 .05 3 0.765 1.638 2.353 t 2.920 t değerleri

Populasyonun standart sapması X bilinmediğinde ve n< 30 olduğunda ortalama için güven aralığı 1. Varsayımlar: Popülasyonun standart sapması bilinmiyor Populasyon normal dağılımlıdır. 2. Student’ın t Dağılımı kullanılır. 3. Güven aralığı tahmini: Örneğin standart sapması

ORTALAMA İÇİN GÜVEN ARALIĞI Populasyonun standart sapması X bilinmediğinde ve populasyonun normal dağıldığı varsayımı altında güven aralığı tahmini:  /2  /2 1 -  s

ÖRNEK Bir fabrikada rasgele üretilen 25 ürünün ortalama ağırlığı 1040 gr standart sapması 25 gr bulunmuştur. %95 güvenle bu imalat prosesinde üretilen ürünlerin ortalama ağırlığı hangi aralıkta yer alır?

Bir Oranın Güven Aralığı Örnek oranı p anakütle oranı P nin nokta tahminidir. 1. Varsayımları İki kategorik çıktı vardır. Populasyon binom dağılımı gösterir. 2. Güven aralığı tahmini: Özellikli birim sayısı Örnek hacmi 96

ÖRNEK: 400 lise öğrencisinden oluşan bir örnekte 32 öğrenci üniversite sınavını kazanmıştır. Üniversite öğrencilerinin sınavı kazanma oranı için %95’lik güven aralığını bulunuz. 97

İki Ortalamanın Farkı İçin Güven Aralığı Örnek ortalamalarından büyük olan ile gösterilirse örnek ortalamaları arasındaki farktan hareketle anakütle ortalamaları arasındaki farkın güven sınırları aşağıdaki gibi olur. Populasyon Varyansları Biliniyorsa: Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda:

Örnek Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun başlangıcından 6 hafta sonra her iki sınıfa da aynı test uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama başarı notu 86 ve standart sapması 12, B sınıfından rassal olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama başarı notları arasındaki farkın güven aralığını %99 olasılıkla belirleyiniz. 99

Örnek

Örnek İki anakütleden tesadüfi olarak seçilen ve hacimlerindeki iki küçük örnekten hareketle anakütle ortalamaları arasındaki farkın güven sınırları belirlenebilir. Birinci örneğin serbestlik derecesi n1 -1 ve ikinci örneğin serbestlik derecesi n2 – 1 dir ve toplam serbestli derecesi olur. Anakütle ortalamaları arasındaki farkın güven aralığı belirlenirken serbestlik derecesine ve hata payına göre t tablo değerleri bulunur.

ÖRNEK 13 deneme sonrasında bir benzin pompası ortalama 125 ml fazla benzin ölçümü yaparken standart sapma 17 ml olmuştur.Bir başka benzin pompası ise 10 deneme sonrasında deneme başına ortalama 110 ml fazla benzin ölçümü yapılmış ve standart sapması 19 ml bulunmuştur. Anakütle ortalamaları arasındaki farkın %99 güven sınırlarını bulunuz. Pompaların fazla ölçümleri arasındaki fark %99 güvenle -7.68 ml ile 37.68 ml arasındadır.

İki Oran Farkının Güven Aralığı 1. Varsayımları İki kategorik çıktı vardır. Populasyonlar binom dağılımı gösterir. 2. Güven aralığı tahmini: Örnek oranlarından büyük olan p1 ile gösterilirse örnek oranları arasındaki farktan hareketle anakütle oranları arasındaki farkın güven sınırları aşağıdaki gibi olur. İki oran farkının standart sapması 103

İki Oran Farkının Güven Aralığına Örnek İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının farkının %95’lik güven aralığını bulunuz. n1 = 1000, n2 = 1000 104

Eşleştirilmiş Örnek t Testi Aynı veya benzer denekler üzerinde birbirinden farklı iki işlemin uygulanması sonucu elde edilen verilere eşleştirilmiş örnekler denir. 1. İki ilişkili populasyonun ortalamasını test eder. Çift ya da eşleştirilmiş Tekrarlı gözlemler (önce/sonra) 2. Nesneler arasındaki varyasyonu ortadan kaldırır. Varsayımları İki populasyon da normal dağılımlıdır. Eğer normal değilse normale yaklaşmaktadır. (n1  30 & n2  30 )

Eşleştirilmiş Örnek t Testi İki komisyoncunun aynı evlere farklı fiyatlar verdiği iddia edilmektedir. İddiayı test etmek için 12 ev seçiliyor ve komisyonculardan bu evlere 1000$ bazında fiyat vermeleri isteniyor. Elde edilen sonuçlar aşağıdaki gibidir.İki komisyoncunun fiyat ortalamaları arasındaki farka ilişkin güven aralığını hesaplayınız. Komisyoncular Evler A B D D2 1 181.0 182.0 -1.0 1.00 2 179.9 180.0 -0.1 0.01 3 163.0 161.5 1.5 2.25 4 218.0 215.0 3.0 9.00 5 213.0 216.5 -3.5 12.25 6 175.0 0.0 0.00 7 217.9 219.5 -1.6 2.56 8 151.0 150.0 1.0 9 164.9 165.5 -0.6 0.36 10 192.5 195.0 -2.5 6.25 11 225.0 222.7 2.3 5.29 12 177.5 178.0 -0.5 0.25 Toplam -2.0 40.22

ttab : t11,0.05 = ± 2.201

BİR POPULASYON VARYANSI İÇİN GÜVEN ARALIKLARI Bir anakütle varyansı için de güven aralığı bulmak gerekir. Bu tahminler örneklem varyansına dayanır. Varyansı olan bir normal anakütleden n gözlemli rassal bir örneklem seçilsin. Örneklem varyansı da s2 ile gösterilsin. Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına uymaktadır. Bu bulgu, normal bir dağılımdan örneklem alındığında anakütle varyansı için güven aralıklarının türetilmesinin temelini oluşturur.

Örneklem varyansının gözlenen belli değeri ise, anakütle varyansının güven aralığı aşağıdaki gibidir: Örneğin a=0.05 n=10 olsun 1-a

Örnek Bir çimento fabrikasında üretilen çimentodan yapılan betonların sağlamlığının incelenmesi amacıyla 10 beton örneği alınmış ve bu örneklerin sağlamlılıkları saptanmıştır. Bu örneklerin ortalama ve varyansı olarak bulunmuştur. Fabrikanın ürettiği tüm betonların varyansına ilişkin güven aralığını hesaplayınız. a=0.10

ÖRNEK Denenen bir motorun 16 deneme sürüşündeki yakıt tüketimlerinin standart sapması 2.2 golondur. Motorun yakıt tüketiminin gerçek değişkenliğini ölçen anakütle varyansının % 99 güven aralığını hesaplayınız. n=16 s=2.2

n=16 s=2.2

İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Normal dağılımlı iki populasyonun varyanslarının oranı F dağılımına uymaktadır. F dağılışı simetrik olmayan bir dağılıştır. Bu nedenle güven aralığının hesaplanmasında her iki F değeri için F tablosuna bakmak gerekmektedir. 115

İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Normal dağılımlı iki populasyonun varyanslarının oranına ilişkin güven aralığı : F 117

İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Aşağıda verilen bilgiler yardımıyla pazara sunulan iki ayrı bağımsız hisse senedinin değişkenliklerinin oranına ilişkin çift yönlü güven aralığını bulunuz.

ÖRNEK Pazara yeni sürülmüş on yedi AAA dereceli sınai tahvilden oluşan rassal bir örneklemde vadelerin varyansı 123.35’dir. Onbir yeni CCC dereceli sınai tahvilden oluşan bağımsız bir rassal örneklemde vadelerin varyansı 8.02’dir. Bu iki tahvilin değişkenliklerinin %90 güven aralığını bulunuz. n1=17 s12=123.35 s22=8.02 n1-1=16 n2-1=10 sd. n2=11