Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi

Slides:



Advertisements
Benzer bir sunumlar
Çıkarımsal İstatistik
Advertisements

Uygun Hipotezin Kurulması, Tip I Hata ve Tip II Hata
Bölüm 5 Örneklem ve Örneklem Dağılımları
Hipotez Testleri Uygulamada çoğu zaman örneklem istatistikleri yardımıyla ana kütle parametreleri hakkında bir karara varmaya da çalışılmaktadır. Meselâ.
Kütle varyansı için hipotez testi
GİRİŞ BÖLÜM:1-2 VERİ ANALİZİ YL.
Simülasyon Teknikleri
Sosyal Bilimlerde Araştırma Yöntemleri
POWER ANALİZİ.
İki kütle ortalamasının farkının güven aralığı
BAĞIMSIZ ÖRNEKLEMLER İÇİN T TESTİ
İSTATİSTİK VE OLASILIK I
İstatistik Tahmin ve Güven aralıkları
Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ
VARYANS ANALİZİ İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden.
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
HİPOTEZ TESTLERİ.
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
MINITAB’da Hipotez Testi Uygulamaları
3. Hipergeometrik Dağılım
HİPOTEZ TESTLERİ.
HİPOTEZ TESTLERİ.
OLASILIK DAĞILIMLARI Bu kısımda teorik olasılık dağılımları incelenecektir. Gerçek hayatta birçok olayın dağılımı bu kısımda inceleyeceğimiz çeşitli olasılık.
TAHMİNLEYİCİLERİN ÖZELLİKLERİ ÖRNEKLEME DAĞILIMI
OLASILIK (6BMHMAU102) Bölüm 6 Tahmin Yrd. Doç. Dr. İmran GÖKER.
PARAMETRİK ANALİZ TEKNİKLERİ
Prof. Dr. Hüseyin BAŞLIGİL
OLASILIK ve OLASILIK DAĞILIMLARI
Örnekleme Dağılımları
Büyük ve Küçük Örneklemlerden Kestirme
ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ
SÜREKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK YOĞUNLUK FONKSİYONLARI
İki Ortalama Farkının Test Edilmesi
MATEMATİKSEL İSTATİSTİK VE OLASILIK II
KESİKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK DAĞILIMLARI
THY Uygulaması Araştırması
KRUSKAL WALLIS VARYANS ANALİZİ
Kİ-KARE DAĞILIMI VE TESTİ
ÖRNEKLEME DAĞILIMI NOKTA TAHMİNİ VE GÜVEN ARALIKLARI
Tüketim Gelir
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
ÖRNEKLEME DAĞILIMI NOKTA TAHMİNİ VE GÜVEN ARALIKLARI
HİPOTEZ TESTLERİNE GİRİŞ
Örneklem Dağılışları.
Asimetri ve Basıklık Ölçüleri
Asimetri ve Basıklık Ölçüleri
Bilişim Teknolojileri için İşletme İstatistiği
Bilişim Teknolojileri için İşletme İstatistiği
Tek Anakütle Ortalaması İçin Test
İletişim Fakültesi Bilişim A.B.D.
Örneklem Dağılışları ve Standart Hata
OLASILIK DAĞILIMLARI Bu kısımda teorik olasılık dağılımları incelenecektir. Gerçek hayatta birçok olayın dağılımı bu kısımda inceleyeceğimiz çeşitli olasılık.
HİPOTEZ TESTLERİNE GİRİŞ
İÇERİK HİPOTEZ TESTLERİ Hipotez Geliştirme Örnek Örnek 2 Örnek 3
İstatistik Tahmin ve Güven aralıkları
İSTATİSTİKTE TAHMİN ve HİPOTEZ TESTLERİ İSTATİSTİK
İSTATİSTİK II Hipotez Testleri 3.
1 İ STATİSTİK II Tahminler ve Güven Aralıkları - 1.
Rastgele Değişkenlerin Dağılımları
İSTATİSTİK II Örnekleme Dağılışları & Tahminleyicilerin Özellikleri.
3. Hipergeometrik Dağılım
Uygun örneklem SayISI hesaplama Power (güç) analİzİ
ANLAM ÇIKARTICI (KESTİRİMSEL) İSTATİSTİK
HİPOTEZ TESTLERİ.
Sapma (Dağılma) ölçüleri
Tıp Fakültesi UYGULAMA 2
Tüketim Gelir
5 Gamma Dağılımı Gamma dağılımının yoğunluk fonksiyonu şöyledir.
OLASILIK DAĞILIMLARI Bu kısımda teorik olasılık dağılımları incelenecektir. Gerçek hayatta birçok olayın dağılımı bu kısımda inceleyeceğimiz çeşitli olasılık.
Sunum transkripti:

Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi Normal dağılan iki kütle ortalamasının farkını test etmek için kütle varyanslarının bilinip bilinmemesine göre testler yapılır. 1) Kütle varyanslarının (12 ve 22 ) bilinmesi durumu: Normal dağılan iki kütlenin varyasları biliniyorsa farklarının dağılımının normal olduğu kabul edilir. n1 ve n2 birimlik iki örneğin ortalamaların farkının standart sapması ( standart hata) şöyle yazılır: Buna göre iki örnek ortalamasının farkı standart normal değişkene şöyle dönüştürülür. Deneysel Z değeri kritik Z değerinden ötede ise hipotez ret, aksi halde kabul edilir.

Problem A ve B marka pillerin ortalama ömürlerinin aynı olduğu standart sapmalarının ise A marka için 50, B marka için 60 saat olduğu bildirilmiştir. Bu durumu araştırmak için A marka pillerden rastgele 40 pil alınmış ortalama ömrünün 300 saat, B marka pillerden 50 tanesi rastgele alınmış ortalama ömrünün 285 saat olduğu görülmüştür. a) Buna göre %1 anlam düzeyinde iki pilin ortalama ömürlerinin farklı olup olmadığını araştırınız. b) olma olasılığı ne olur? Çözüm: H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 ) H1 : µ1 - µ2 ≠ 0 ( veya µ1 ≠ µ2 ) Anlam düzeyi:  = 0,01 Kritik değer ( Teorik dağılım değeri): Z/2 = Z0,01/2 = Z0,005= 2,58

Problem - Çözüm Deneysel Z değeri: Karar: Z0,005= 2,58 > Zdeneysel = 1,29 olduğundan H0 kabul edilir. Yani iki marka pilin ortalama ömürlerinin farklı olduğunu söylemek %1 anlam düzeyinde mümkün değildir. b) olma olasılığı: P(Z > 1,29) olasılığı demektir.

Kütle varyansları (12 ve 22) bilinmiyor fakat eşit kabul edildiğinde iki kütle ortalamasının farkının testi (Küçük örnek testi) s12 ve s22, 12 ve 22 nin eğilimsiz tahmincileri olmak üzere ortalamaların farkının varyansı: olup, örnek ortalamaları standart değişkene şöyle dönüştürülür. Değişkeninin dağılımı (n1+n2-2) serbestlik dereceli t dağılımına uyar. Deneysel t değeri ve kritik dağılım değeri karşılaştırılarak karar verilir.

Problem Bir işletmede aynı parçayı üreten iki işçinin bu parçayı üretim sürelerinin varyanslarının eşit olduğu bildirilmiştir. Bu işçilerin söz konusu parçayı üretim sürelerinin ortalamalarının eşit olup olmadığını araştırmak amacıyla 1. işçinin ürettiği 12 parça rastgele seçiliyor ortalamasının 20 dakika standart sapmasının 5 dakika olduğu görülüyor. 2. işçinin ürettiği parçalardan rastgele 15 tanesi gözlemleniyor ortalamasının 23 dakika, standart sapmasının 7 dakika olduğu görülüyor. Birinci işçinin üretim süresinin ikinciden düşük olup olmadığını %5 anlam düzeyinde test edip karar veriniz. Çözüm: H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 ) H1 : µ1 - µ2 < 0 ( veya µ1 < µ2 ) Anlam düzeyi:  = 0,05 Kritik dağılım değeri (teorik değer): t0,05, 12-1+15-1 = t0,05,11+14  t0,05,25= -1,708

Problem - Çözüm Olur. Böylece deneysel t değeri şöyle bulunur. Karar: t = -3,138 < t0,05,25= -1,708 olduğundan H0 hipotezi reddedilir. İki işçinin üretim süreleri farklı olabilir.

Kütle varyansları (12 ve 22) bilinmiyor ve eşit değilse iki kütle ortalamasının farkının testi (Küçük örnek testi) Eğer kütle varyansları bilinmiyor ve eşit değilse, t istatistiğinin dağılımı her iki kütlenin normal dağılması kaydıyla v serbestlik dereceli t dağılımına uyar.

Problem Aynı çaplı iki farklı çekme halatının kopma kuvvetlerinin farklı olup olmadığı araştırılıyor. Bu amaçla A marka halatlardan rastgele 10 örnek alınıp test edildiğinde kopma kuvvetlerinin ortalamasının 25 ton standart sapmasının 4 ton olduğu görülüyor. B marka halatlardan 14 örnek alınıp test edildiğinde ortalama kopma kuvvetinin 21 ton standart sapmasının 8 ton olduğu görülmüştür. Her iki kütlenin kopma kuvvetlerinin dağılımının normal olduğu kabul ediliyor. Bu verilere göre A marka halatların kopma kuvvetinin B den fazla olup olmadığını %5 anlam düzeyinde test ederek karar veriniz. Çözüm: H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 ) H1 : µ1 - µ2 > 0 ( veya µ1 > µ2 ) Anlam düzeyi:  = 0,05

Problem - Çözüm Serbestlik derecesi: Kritik dağılım değeri: t0,05,20 = 1,725 Deneysel t değeri: Karar: tdeneysel =1,62 < t0,05,20 = 1,72 olduğundan H0 hipotezi kabul edilir. A marka halatların kopma kuvveti B den farklı değildir.

Varyansı bilinmeyen kütlelerin ortalamalarının farkı için büyük örnek yaklaşımı Dağılımı normal olmayan iki kütlenin ortalamaları için örnekler küçük ise herhangi bir çözüm önerilememektedir. Bununla birlikte dağılımı ne olursa olsun eğer her iki kütleden çekilen örneklerin hacmi büyük ise ortalamaların farkının normale yaklaştığı kabul edilerek hipotezler test edilebilir. Böyle bir durumda test istatistiği Şeklinde olur. Kritik dağılım değeri normal dağılımdan elde edilerek bu test istatistiği ile karşılaştırılarak karar verilir.

Eşlenik örneklerde iki ortalamanın farkının testi Buraya kadar incelediğimiz ortalamalarla ilgili testlerde örneklerin bağımsız olduğu yani farklı kütlelerden geldiği kabul edilmişti. Bu konuda inceleyeceğimiz örnekler eşlenik yani bağımlı örnekler olacaktır. Burada birimler üzerinde farklı zamanlarda yapılan iki ölçüm çiftinin ortalamalarının farkı araştırılmaktadır. x1i : 1. ölçümde i. birimin değeri x2i : 2. ölçümde i. birimin değeri i=1,2,3,……,n olup n: ölçüm çiftlerinin sayısıdır. D= x1i - x2i , örnek çiftleri arasındaki farklar : Farkların örneklem ortalaması= SD : Di lerin standart sapması

Eşlenik örneklerde iki ortalamanın farkının testi nın standart hatası D’ lerin dağılımı normal kabul edilir. Bu durumda için test istatistiği şöyle yazılır. t test istatistiği n-1 serbestlik dereceli t dağılımı kritik değeri ile karşılaştırılarak hipotezin kabul veya reddine karar verilir.

Problem Bir ilk öğretim okulunun 4. sınıf öğrencilerinin okuma hızlarının gelişimi üzerine yapılan bir araştırmada dönem başı ve sonunda olmak üzere eşlenik örnekleme yapılmış ve aşağıdaki veriler elde edilmiştir. Veriler okunan kelime sayılarıdır. Buna göre öğrencilerin okuma hızları dönem başına göre artış göstermiş midir? %5 anlam düzeyinde test edinip karar veriniz. Dönem başı 60 75 80 65 66 72 87 90 82 Dönem sonu 77 70 85 95

Problem - Çözüm H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 ) Dönem başı 60 75 80 65 66 72 87 90 82 Dönem sonu 77 70 85 95 Di -15 -2 -5 1 -8 2 -10,3 2,7 -0,3 5,7 -3,3 6,7 106 7,29 7,3 0,09 32,5 10,9 44,9 H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 ) H1 : µ1 - µ2 < 0 ( veya µ1 < µ2 ) ∑Di = -47 olup Di lerin ortalaması ve standart sapması şöyle bulunur.

Problem - Çözüm D’lerin dağılımının standart hatası şöyle bulunur. Anlam düzeyi %5 olup kritik dağılım değeri: t0,05,9 = -1,833 Deneysel test istatistiği şöyle bulunur:

Problem - Çözüm Karar: tdeneysel =-2,93 < t0,05,9 = -1,833 olduğundan H0 hipotezi reddedilir. Yani öğrencilerin okuma hızı dönem sonunda dönem başına göre artış göstermiştir.

İki oranın (Binom parametresi) farkının testi n1 ve n2 birimlik örneklerin oranları sırası ile p1 ve p2 olmak üzere örnek hacimleri yeterince büyük olduğu takdirde normal dağılıma yaklaşır. n1 hacimli örnekte uygun hal sayısı X1 ve n2 hacimli örnekte uygun hal sayısı X2 olmak üzere; Test edilecek H0 hipotezi: H0 : şeklinde oluşturulur. nin her biri p parametresinin eğilimsiz tahmincileridir. nin standart hatası şöyle yazılır. Z nin dağılımı normaldir.

İki oranın (Binom parametresi) farkının testi p nin eğilimsiz tahmincileri olmakla birlikte (p1 = p2) hipotezi doğru ise p nin en iyi tahmincisi olarak birleştirilmiş örneğin oranı kullanılır. Buna göre test istatistiği: şeklinde yazılabilir. Şu halde (p1 – p2= p) olursa 1. formül, (p1 – p2= 0) ise 2. formül kullanılarak hipotezler test edilir.

Problem Bir seramik fabrikasında lavabo üretimi için iki üretim hattı mevcuttur. Hatların kusurlu oranlarının farklı olup olmadığı araştırılıyor. Bunun için yapılan araştırmada 1. hattan rastgele seçilen 140 lavabonun 8 tanesinin, 2. hattan çekilen 200 lavabonun 16 tanesinin kusurlu olduğu görülmüştür. a) Kusurlu oranlarının aynı olduğunu düşünerek b) 2. hattın kusurlu oranının 1. den %1 daha fazla olduğunu düşünerek hipotezleri %5 anlam düzeyinde test ediniz

Problem - Çözüm a) H0 : p1 – p2 = 0 H1 : p1 – p2 < 0 p1 = p2 kabul edildiğinden birleştirilmiş örnek varyansı kullanılarak test yapılır. Birleştirilmiş örneğin oranı: Test istatistiği: Anlam düzeyi  = 0,05 olup Kritik dağılım değeri: Z0,05 = -1,65 olur. Karar: Zdeneysel=-0,82>Z0,05=-1,65 olduğundan H0 kabul edilir. İki hattın kusurlu oranları farklı değildir.

Problem - Çözüm b) H0 : p1 – p2 = -0,01 H1 : p1 – p2 < -0,01 Standart hata Test istatistiği Anlam düzeyi = 0,05 olup Kritik dağılım değeri: Z0,05=-1,65 Karar: Zdeneysel=-0,47> Z0,05=-1,65 olduğundan H0 kabul edilir. Yani ikinci hattın kusurlu oranları 1. hattın kusurlu oranından %1 daha fazladır.

Problem Bir iş istasyonunda belli bir parçanın montajı yapılmaktadır. Ustabaşı parçanın ortalama montaj süresinin 20 dakika olduğunu bildirmiştir. İşletmede çalışan endüstri mühendisi parçanın montajının daha uzun sürede gerçekleştirildiğini düşünmektedir. Parçanın montaj süresinin belirlenmesi için hattan rastgele seçilen 25 parçanın montaj süresi gözlemleniyor. Ortalama montaj süresi 22 dakika, standart sapması 4 dakika olarak bulunuyor. Elde edilen verilere göre; a) Hipotezleri oluşturunuz. b) Hipotezi %1 anlam düzeyinde test ediniz. c) %5 anlam düzeyinde hipotezin kabulü için 25 birimlik örnekte ortalama montaj süresi en fazla ne kadar olmalıdır? Hesaplayınız.

Problemin devamı Parçanın montaj süresinin varyansının 5 dakika olduğu bilinmektedir. Ancak montaj süresinin ortalaması 20 dakikadan 22 dakikaya çıktığı taktirde %5 anlam düzeyinde bunun 25 birimlik bir örnekte fark edilememe olasılığı ne olur? (β hatası, yani yanlış hipotezin kabulü olasılığı ) Testin gücü ne olur?

Problemin devamı Aynı parçanın montajı için ikinci bir hattan 20 parça seçiliyor ve montaj süresi gözlemleniyor. Ortalama montaj süresi 23 dakika, standart sapması 6 dakika olarak hesaplanıyor. (Birinci hattan seçile 25 parçanın ortalama montaj süresi 20 dakika, standart sapması 5 dakika idi) Bu verilere göre İki hatta montajı yapılan parçaların ortalama montaj süresinin farklı olup olmadığını %5 anlam düzeyinde test ederek karar veriniz.

Problem Bir işletmenin insan kaynakları departmanı personelin işe geç kalma oranının %8 olduğunu bildirmiştir. İşletme yönetimi bu durumu araştırmak ve önlemler almak amacıyla bir çalışma başlatmıştır. Bunun için rastgele seçilen 120 personelden 15 tanesinin işe geç kaldığı görülmüştür. Bu verilere dayanarak işletmede işe geç kalma oranının %8 den fazla olup olmadığını %5 anlam düzeyinde araştırınız.

Problem – devam- Yine bu işletmede işe geç kalan personel oranının departmanlar arasında farklılık gösterip göstermediği araştırılıyor. Bunun için A departmanından 80 kişi rastgele seçilip gözlemleniyor bunların 10 tanesinin, B departmanından seçilen 60 kişiden 12 tanesinin işe geç kaldığı görülmüştür. Her iki departmandaki personelin işe geç kalma oranlarının farklı olup olmadığını %5 anlam düzeyinde test ederek karar veriniz.