İki Örneğe Dayanan İstatistiksel Yorumlama İSTATİSTİK II İki Örneğe Dayanan İstatistiksel Yorumlama
Bu sorulara nasıl cevap veririz? Kim daha başarılı? Kadınlar yada erkekler? Hangi program daha hızlı öğrenilebiliyor? Windows yada DOS? D O S
İki Anakütle Ortalaması Arasındaki Farkın Tahmini ve Hipotez Testleri: Bağımsız ve Büyük Örnekler
Tanımlar Bağımsız İki Örnek Bir anakütleden seçilen örnek değerleri, diğer bir anakütleden seçilen örnek değerleri ile ilişkisizdir veya bir şekilde eşleşmemiştir. Bir örnekteki değerler, diğer bir örnekteki değerler ile ilişkili ise, bu tür örnekler bağımlıdır. Böyle örneklere eşleştirilmiş örnekler denir. Text will use the wording ‘matched pairs’. Example at bottom of page 438- 439
Varsayımlar 1. İki örnek bağımsızdır. 2. İki örnek de büyüktür. Yani, n1 >= 30 ve n2 >= 30. Bu varsayım sağlanmadığında s1 ve s2 biliniyor ve her iki anakütlenin dağılışı da normal olmalıdır. 3. Her iki örnek basit şans örneği olmalıdır. page 439
Örnekleme Dağılışları In this diagram, do the populations have equal or unequal variances? Unequal. 38
Örnekleme Dağılışı
Güven Aralığı (x1 - x2) - E < (µ1 - µ2) < (x1 - x2) + E 1 2 E = z 2 + n1 n2 s1, s2 bilinmediğinde, n1 >= 30 ve n2 >= 30 ise,
Örnek Kadınlar evde erkeklerden daha çok mu çalışmaktadır? “1988 National Survey of Families and Households” isimli çalışmada şu veriler elde edilmiş: Cinsiyet örnek büyüklüğü ortalama süre standart sapma erkek 4252 18.1 12.9 kadın 6764 32.6 18.2 İlgilenilen parametre 2 - 1 9
2 - 1 için Güven Aralığı 1 – a = %99 olsun. Güven aralığı, = (32.6 – 18.1) +/- 2.575*( √((12.9)2/4252 + (18.2)2/6764)) = 14.5 +/- 2.575*(0.30) = 14.5 +/- .8, veya (13.7,15.3) %99 güvenle, evdeki çalışma süreleri ortalamaları arasındaki farkın, 13.7 ile 15.3 saat arasında olduğu söylenebilir. 10
Hipotezler H0: m1 – m2 = 0 H1: m1 – m2 ≠ 0 (Çift Taraflı Test) H1: m1 – m2 > 0 (Tek Taraflı Test) H0: m1 – m2 0 H1: m1 – m2 < 0 (Tek Taraflı Test)
z = Test İstatistiği (x1 - x2) 1. 2 n1 n2 + s1, s2 bilinmediğinde, n1 >= 30 ve n2 >= 30 ise,
Coca Cola Pepsi’ye Karşı İki kola markası Coca Cola ve Pepsinin kutulu ürünlerinin içerik ağırlıklarını (pound) karşılaştırmak için her iki üründen şans örnekleri alınmış ve aşağıdaki veriler elde edilmiştir. 0.01 önem seviyesinde, Coca Cola’ların ortalama ağırlıklarının, Pepsi’lerin ortalama ağırlıklarından farklı olup olmadığını araştırınız. Coca Cola Pepsi n 36 36 x 0.81682 0.82410 s 0.007507 0.005701
Coca Cola Pepsi’ye Karşı İddia: 1 2 Ho : 1 = 2 H1 : 1 2 = 0.01 H0 ret H0 reddedilemez H0 ret Z = - 2.575 Z = 2.575 1 - = 0 or Z = 0
Coca Cola Pepsi’ye Karşı z = (0.81682 - 0.82410) 0.0075707 2 0.005701 2 + 36 36 = - 4.63
Coca Cola Pepsi’ye Karşı İddia: 1 2 Ho : 1 = 2 H1 : 1 2 = 0.01 H0 ret H0 reddedilemez H0 ret Z = - 2.575 Z = 2.575 Örnek verisi: z = - 4.63 1 - = 0 or Z = 0
Coca Cola Pepsi’ye Karşı İddia: 1 2 Ho : 1 = 2 H1 : 1 2 = 0.01 Coca Cola’nın ortalama kutu içerik ağırlıkları, Pepsi’nin ortalama kutu içerik ağırlıklarından anlamlı derecede farklıdır. H0 ret H0 reddedilemez H0 ret Z = - 2.575 Z = 2.575 Örnek verisi: z = - 4.63 1 - = 0 or Z = 0
İki Anakütle Ortalaması Arasındaki Farkın Tahmini ve Hipotez Testleri: Bağımsız ve Küçük Örnekler
Varsayımlar İki örnek de basit şans örneğidir ve bağımsızdır. Anakütlelerin dağılışı normaldir ve örneklerin en az biri 30’un altındadır. s1 ve s2 bilinmemektedir. s1 = s2.
Örnekleme Dağılışı serbestlik derecesi n1 + n2 – 2
Örnek Ofis mobilyalarının montajında iki yöntemin karşılaştırılması yapılmak istenmektedir. Her iki yöntem ile monte edilmiş 25’er mobilya için montaj süreleri kaydedilmiştir. %95 güven ile ortalama montaj süreleri arasındaki fark için aralık tahminini bulunuz. İki yöntem arasında bir fark var mıdır?
Örnek Örnek varyansları yakın oldukları için eşit olduğunu kabul ediyoruz. İlerleyen bölümlerde, eşitliğin nasıl kontrol edileceği ele alınacaktır!
Güven Aralığı…
Örnek Gün 21 25 Ortalama 3.27 2.53 Std Sapma 1.30 1.16 Bir aracı kurumda çalışan bir finansal analistten, iki hisse senedinin ortalama fiyatlarının aynı olup olmadığını araştırması istenmiştir. Kapanış fiyatlarından, aşağıdaki veriler elde edilmiştir. A Hisse S. B Hisse S. Gün 21 25 Ortalama 3.27 2.53 Std Sapma 1.30 1.16 Aynı standart sapmalı, normal dağılış varsayımıyla, ortalama kapanış fiyatları aynı kabul edilebilir mi? ( = .05) © 1984-1994 T/Maker Co.
Çözüm H0: 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 (1 2) .05 df 21 + 25 - 2 = 44 Kritik Değerler Test İstatistiği: Karar: Sonuç: 41
Çözüm H0: 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 (1 2) .05 df 21 + 25 - 2 = 44 Kritik Değerler Test İstatistiği: Karar: Sonuç: 41
Çözüm 42
Çözüm H0: 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 (1 2) .05 df 21 + 25 - 2 = 44 Kritik Değerler Test İstatistiği: Karar: 2.0154 < 2.03 H0 ret Sonuç: Ortalamalar arasında anlamlı bir fark vardır. 41
İki Anakütle Ortalaması Arasındaki Farkın Tahmini ve Hipotez Testleri: Eşleştirilmiş Örnekler
Örnek İnsan kaynakları departmanında çalıştığınızı düşünün. Bir eğitim programının etkin olup olmadığını anlamak istiyorsunuz. Aşağıdaki skor verilerine sahibiz: İsim Önce(1) Sonra (2) Sam 85 94 Tamika 94 87 Brian 78 79 Mike 87 88
Varsayımlar 1. Örnek verileri eşleştirilmiştir. 2. Örnekler, basit şans örnekleridir. 3. Eşleştirilmiş veri sayısı küçük ise (n < 30 ise), eşleşmiş verilerin farklarının dağılışı normal olmak zorundadır. page 449 of text
Notasyon µd = eşleştirilmiş verilerin farklarının (d’ler) anakütlesi için ortalama değer. d = eşleştirilmiş örnek verilerinin farkları d’lerin ortalaması. (x - y değerlerinin ortalamasına eşittir) sd = eşleştirilmiş örnek verilerinin farkları d’ler için standart sapma. n = eşleştirilmiş veri sayısı.
Kritik Değerler n < 30 ise, kritik değerler t dağılışından bulunur. n >= 30 ise, kritik değerler normal dağılıştan bulunur. page 451 of text Hypothesis example given on this page
Güven Aralığı d - E < µd < d + E E = t/2,n-1 sd Serbestlik derecesi = n -1
Örnek (1) (2) Mağaza Müşteri Rakip d 1 10 11 -1 Bir Pazar araştırmaları uzmanı müşterisinin bir ürününün satışları ile rakibinin aynı ürününün satışlarını karşılaştırmak istemektedir. Bunun için rastgele 8 perakende satış mağazası seçilmiş ve yandaki veriler elde edilmiştir. %98 güven ile müşterinin ortalama satışları ile rakip firma ortalama satışları arasındaki farkı tahmin edelim. (1) (2) Mağaza Müşteri Rakip d 1 10 11 -1 2 8 11 -3 3 7 10 -3 4 9 12 -3 5 11 11 0 6 10 13 -3 7 9 12 -3 8 8 10 -2 Why related populations? Control for differences in store price. Some stores might be higher priced in terms of all goods. Allow students about 15 minutes to solve this.
Örnek (1) (2) Mağaza Müşteri Rakip d 1 10 11 -1 Bir Pazar araştırmaları uzmanı müşterisinin bir ürününün satışları ile rakibinin aynı ürününün satışlarını karşılaştırmak istemektedir. Bunun için rastgele 8 perakende satış mağazası seçilmiş ve yandaki veriler elde edilmiştir. müşterinin ortalama satışları, rakip firma ortalama satışlarından daha az mıdır? a = 0.01 için araştırınız. (1) (2) Mağaza Müşteri Rakip d 1 10 11 -1 2 8 11 -3 3 7 10 -3 4 9 12 -3 5 11 11 0 6 10 13 -3 7 9 12 -3 8 8 10 -2 Why related populations? Control for differences in store price. Some stores might be higher priced in terms of all goods. Allow students about 15 minutes to solve this.
Çözüm H0: D = 0 (D = 1 - 2) Ha: D < 0 = .01 sd = 8 - 1 = 7 Kritik değer Test İstatistiği: Karar: Sonuç: 2 . 25 d t 5 . 486 S 1 . 16 D n 8 D ta,n-1 = t0.01,7 = 2.998 Reject Ho Ret .01 Müşterinin satışları rakibinden azdır. -2.998 t
Örnek = 0.02 /2 = 0.01 sd = 8 - 1 = 7 Kritik değer: ta/2,n-1 = t0.01,7 = 2.998
İki Anakütle Oranı Arasındaki Farkın Tahmini ve Hipotez Testleri
Varsayımlar 1. İki bağımsız basit şans örneğinden elde edilmiş oranlara sahibiz. 2. Her iki örnek için, np 5 ve nq 5 koşulları sağlanmıştır. page 458 of text
Notasyon Anakütle 1 için: ^ p1 = x1/n1 (örnek oranı) q1 = 1 - p1 ^ ^ ^ p1 = anakütle oranı n1 = örnek büyüklüğü x1 = örnekteki başarı sayısı ^ p1 = x1/n1 (örnek oranı) q1 = 1 - p1 ^ ^ Anakütle 2 için aynı tanımlamalar sırasıyla ^ ^ p2, n2 , x2 , p2. ve q2 , için de geçerlidir.
Oranlar Arasındaki Farkın Örnekleme Dağılışı
p1 - p2 için Güven Aralığı ^ ^ ^ ^ (p1 - p2 ) - E < ( p1 - p2 ) < (p1 - p2 ) + E ^ ^ ^ ^ p1 q1 p2 q2 E = z + n1 n2 Example at the bottom of page 463 Rationale for the procedures of this section on page 464-465.
Örnek Bir ilaç firması, ürettiği ağrı kesici ilacın etkinliğini araştırmaktadır. Bunun için 500 kişiye ilacını, 400 kişiye de placebo vermiştir. İlaç verilenlerden 350’si 15 dakika sonra ağrının geçtiğini söylemiştir. Placebo verilenlerden ise 235’inin 15 dakika sonra ağrının geçtiğini söylemiştir. Gerçek oranlar arasındaki farkı %99 güven ile tahmin ediniz.
Örnek Define hypotheses:
Hipotezler 9
Test İstatistiği
Örnek Bir firmanın personel müdürü, firmada kullanılmış olan iki ayrı performans değerlendirme yönteminin ne kadar adil olduğu ile ilgili olarak çalışanların algılamalarını ölçmüştür. Yöntem 1’i değerlendiren 78 çalışandan 63’ü bu yöntemi adil bulmuştur. Yöntem 2’yi değerlendiren 82 çalışandan 49’u bu yöntemi adil bulmuştur. 0.01 önem düzeyinde, çalışanların algılamaları arasında fark olup olmadığını test ediniz. To check assumptions, use sample proportions as estimators of population proportion: n1·p = 78·63/78 = 63 n1·(1-p) = 78·(1-63/78) = 15
Çözüm H0: p1 - p2 = 0 H1: p1 - p2 0 = .01 n1 = 78 n2 = 82 Kritik değerler Test İstatistiği: Karar: Sonuç: 11
Çözüm 12
Çözüm H0: p1 - p2 = 0 H1: p1 - p2 0 = .01 n1 = 78 n1 = 82 Kritik Değerler: Test İstatistiği: Karar: Sonuç: H0 Ret İki performans değerlendirme yönteminin adilliğine dair algılamaların oranları farklıdır. 11
İki Varyansın Karşılaştırılması Varyansların karşılaştırılması söz konusu olduğunda, F dağılışı kullanılır: Dağılışın serbestlik dereceleri
İki Varyansın Karşılaştırılması Sıfır hipotezi: H0: İki anakütle varyansı eşit, diğer bir deyişle birbirine oranı “1” anlamına gelmektedir. Buradan, test istatistiği F, sadeleşerek halini alır.
F Dağılışı
Alternatif Hipotez, Test İstatistiği ve Ret Bölgesi ise ise H0 ret ise ise H0 ret H1: ise H0 ret H1: ise H0 ret
Örnek Bir fabrikadaki aynı işi yapan iki makasın aynı kalitede üretim yapıp yapmadığını araştırmak için her iki makasta kesilmiş metal çubuklardan 8’er örnek alınmış ve boy değerleri aşağıdaki gibi bulunmuştur. Kalite ölçüsü olarak varyans kullanılırsa, α = 0.02 için araştırma yapınız. Birinci makas - 7.5, 8.2, 8.1, 8.4, 7.1, 7.3, 7.1, 7.8 İkinci makas - 7.9, 8.4, 8.0, 7.8, 7.5, 7.2, 7.4, 7.3
Örnek H0: H1: 1.565 < 6.9929 H0 reddedilemez.