İSTATİSTİK II Tahminler ve Güven Aralıkları - 2
Tahminler ve Güven Aralıkları - 2 İki Anakütle Ortalaması Arasındaki Farkın Tahmini: Bağımsız ve Büyük Örnekler 2 İki Anakütle Ortalaması Arasındaki Farkın Tahmini: Bağımsız ve Küçük Örnekler 3 İki Anakütle Ortalaması Arasındaki Farkın Tahmini: Eşleştirilmiş Örnekler 4 İki Anakütle Oranı Arasındaki Farkın Tahmini
Bu sorulara nasıl cevap veririz? Kim daha başarılı? Kadınlar yada erkekler? Hangi program daha hızlı öğrenilebiliyor? Windows yada DOS? D O S
İki Anakütle Ortalaması Arasındaki Farkın Tahmini: Bağımsız ve Büyük Örnekler
Tanımlar Bağımsız İki Örnek Bir anakütleden seçilen örnek değerleri, diğer bir anakütleden seçilen örnek değerleri ile ilişkisizdir veya bir şekilde eşleşmemiştir. Bir örnekteki değerler, diğer bir örnekteki değerler ile ilişkili ise, bu tür örnekler bağımlıdır. Böyle örneklere eşleştirilmiş örnekler denir. Text will use the wording ‘matched pairs’. Example at bottom of page 438- 439
Varsayımlar 1. İki örnek bağımsızdır. 2. İki örnek de büyüktür. Yani, n1 >= 30 ve n2 >= 30. Bu varsayım sağlanmadığında s1 ve s2 biliniyor ve her iki anakütlenin dağılışı da normal olmalıdır. 3. Her iki örnek basit şans örneği olmalıdır. page 439
Örnekleme Dağılışları In this diagram, do the populations have equal or unequal variances? Unequal. 38
Örnekleme Dağılışı
Güven Aralığı (x1 - x2) - E < (µ1 - µ2) < (x1 - x2) + E 1 2 E = z 2 + n1 n2 s1, s2 bilinmediğinde, n1 >= 30 ve n2 >= 30 ise,
Örnek Kadınlar evde erkeklerden daha çok mu çalışmaktadır? “1988 National Survey of Families and Households” isimli çalışmada şu veriler elde edilmiş: Cinsiyet örnek büyüklüğü ortalama süre standart sapma erkek 4252 18.1 12.9 kadın 6764 32.6 18.2 İlgilenilen parametre 2 - 1 10
2 - 1 için Güven Aralığı 1 – a = %99 olsun. Güven aralığı, = (32.6 – 18.1) +/- 2.575*( √((12.9)2/4252 + (18.2)2/6764)) = 14.5 +/- 2.575*(0.30) = 14.5 +/- .8, veya (13.7,15.3) %99 güvenle, evdeki çalışma süreleri ortalamaları arasındaki farkın, 13.7 ile 15.3 saat arasında olduğu söylenebilir. 11
İki Anakütle Ortalaması Arasındaki Farkın Tahmini: Bağımsız ve Küçük Örnekler
Varsayımlar İki örnek de basit şans örneğidir ve bağımsızdır. Anakütlelerin dağılışı normaldir ve örneklerin en az biri 30’un altındadır. s1 ve s2 bilinmemektedir. s1 = s2.
Örnekleme Dağılışı serbestlik derecesi n1 + n2 – 2
Örnek Ofis mobilyalarının montajında iki yöntemin karşılaştırılması yapılmak istenmektedir. Her iki yöntem ile monte edilmiş 25’er mobilya için montaj süreleri kaydedilmiştir. %95 güven ile ortalama montaj süreleri arasındaki fark için aralık tahminini bulunuz. İki yöntem arasında bir fark var mıdır?
Örnek Örnek varyansları yakın oldukları için eşit olduğunu kabul ediyoruz. İlerleyen bölümlerde, eşitliğin nasıl kontrol edileceği ele alınacaktır!
Güven Aralığı…
İki Anakütle Ortalaması Arasındaki Farkın Tahmini: Eşleştirilmiş Örnekler
Örnek İnsan kaynakları departmanında çalıştığınızı düşünün. Bir eğitim programının etkin olup olmadığını anlamak istiyorsunuz. Aşağıdaki skor verilerine sahibiz: İsim Önce(1) Sonra (2) Sam 85 94 Tamika 94 87 Brian 78 79 Mike 87 88
Varsayımlar 1. Örnek verileri eşleştirilmiştir. 2. Örnekler, basit şans örnekleridir. 3. Eşleştirilmiş veri sayısı küçük ise (n < 30 ise), eşleşmiş verilerin farklarının dağılışı normal olmak zorundadır. page 449 of text
Notasyon µd = eşleştirilmiş verilerin farklarının (d’ler) anakütlesi için ortalama değer. d = eşleştirilmiş örnek verilerinin farkları d’lerin ortalaması. (x - y değerlerinin ortalamasına eşittir) sd = eşleştirilmiş örnek verilerinin farkları d’ler için standart sapma. n = eşleştirilmiş veri sayısı.
Kritik Değerler n < 30 ise, kritik değerler t dağılışından bulunur. n >= 30 ise, kritik değerler normal dağılıştan bulunur. page 451 of text Hypothesis example given on this page
Güven Aralığı d - E < µd < d + E E = t/2,n-1 sd Serbestlik derecesi = n -1
Örnek (1) (2) Mağaza Müşteri Rakip d 1 10 11 -1 Bir Pazar araştırmaları uzmanı müşterisinin bir ürününün satışları ile rakibinin aynı ürününün satışlarını karşılaştırmak istemektedir. Bunun için rastgele 8 perakende satış mağazası seçilmiş ve yandaki veriler elde edilmiştir. %98 güven ile müşterinin ortalama satışları ile rakip firma ortalama satışları arasındaki farkı tahmin edelim. (1) (2) Mağaza Müşteri Rakip d 1 10 11 -1 2 8 11 -3 3 7 10 -3 4 9 12 -3 5 11 11 0 6 10 13 -3 7 9 12 -3 8 8 10 -2 Why related populations? Control for differences in store price. Some stores might be higher priced in terms of all goods. Allow students about 15 minutes to solve this.
Örnek = 0.02 /2 = 0.01 sd = 8 - 1 = 7 Kritik değer: ta/2,n-1 = t0.01,7 = 2.998
İki Anakütle Oranı Arasındaki Farkın Tahmini
Varsayımlar 1. İki bağımsız basit şans örneğinden elde edilmiş oranlara sahibiz. 2. Her iki örnek için, np 5 ve nq 5 koşulları sağlanmıştır. page 458 of text
Notasyon Anakütle 1 için: ^ p1 = x1/n1 (örnek oranı) q1 = 1 - p1 ^ ^ ^ p1 = anakütle oranı n1 = örnek büyüklüğü x1 = örnekteki başarı sayısı ^ p1 = x1/n1 (örnek oranı) q1 = 1 - p1 ^ ^ Anakütle 2 için aynı tanımlamalar sırasıyla ^ ^ p2, n2 , x2 , p2. ve q2 , için de geçerlidir.
p1 - p2 için Güven Aralığı ^ ^ ^ ^ (p1 - p2 ) - E < ( p1 - p2 ) < (p1 - p2 ) + E ^ ^ ^ ^ p1 q1 p2 q2 E = z + n1 n2 Example at the bottom of page 463 Rationale for the procedures of this section on page 464-465.
Örnek Bir ilaç firması, ürettiği ağrı kesici ilacın etkinliğini araştırmaktadır. Bunun için 500 kişiye ilacını, 400 kişiye de placebo vermiştir. İlaç verilenlerden 350’si 15 dakika sonra ağrının geçtiğini söylemiştir. Placebo verilenlerden ise 235’inin 15 dakika sonra ağrının geçtiğini söylemiştir. Gerçek oranlar arasındaki farkı %99 güven ile tahmin ediniz.
Örnek Define hypotheses: