İletişim Fakültesi Bilişim A.B.D. İstatistik-2 Prof.Dr. Cem S. Sütcü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D. cemsutcu.wordpress.com
Neden Örnekleme Anakütledeki tüm elemanları kontrol etmenin fiziksel zorluğu. Tüm anakütleyi kapsamanın uzun zaman alması. Anakütledeki tüm elemanları incelemenin maliyeti. Pek çok durumda örnek sonuçlarının yeterli bulunması. Bazı testlerin yok edici özelliği olması.
Örnekleme Türleri Tesadüfi Olmayan Örnekleme Anakütleden örnek kütleye seçilecek elemanlar belirli özellikleri nedeniyle örnek kütleye seçilir. Tesadüfi olmayan örneklemede bir elemanın örneğe seçilmesi örneği seçen kişinin kararına bağlıdır. Örneklem hatası örnek istatistiği ile ona karşılık gelen anakütle parametresi arasındaki farktır.
Örnekleme Türleri Tesadüfi Örnekleme Basit Tesadüfi Örnekleme Anakütleden örnek kütleye seçilecek her elemanın eşit şansa sahip olması durumudur. Sistematik Tesadüfi Örnekleme Anakütledeki elemanlar belirli bir sırada dizilir. Tesadüfi bir başlangıç noktası seçilir ve sonra her k’ıncı eleman örnek kütleye seçilir.
Örnekleme Türleri Tabakalı Tesadüfi Örnekleme: Anakütle önce ortak özelliklere sahip alt gruplara bölünür. Bunlara tabaka denir. Sonra her bir tabakadan bir örnek kütle seçilir.
Örnekleme Türleri Küme Örneklemesi: Önce anakütle temel birimlere bölünür. Sonra örnekler bu temel birimlerden seçilir. Her birimden eleman seçmek şart değildir.
Standart Hata s s s x s x n n Örnek ortalamalarının örneklem dağılımı bir anakütleden seçilecek, ya da seçilmesi mümkün olan aynı büyüklükteki örneklerin ortalamalarının dağılımıdır. Ortalamanın örneklem dağılımı da denir. Örnek ortalamalarının örneklem dağılımının ölçütü, ortalamanın standart hatasıdır. (standard error of mean = SEM) s x = s n s x = s n veya eğer n >30 ise SEM, s’nın denek sayısının kareköküne bölümüne eşittir. Örneğin µ= 15, s = 3.5, n = 50, SEM = 0.5 ise deneklerin % 95’inin yayılımı 15 ± 2s = 8 – 22 dir. Evrenden seçilecek 50 denekli örneklemlerin % 95’inin ortalamaları ise 15 ± 2SEM = 14 – 16 arasında olacaktır.
Güven Aralığı Eğer anakütle standart sapması biliniyor veya örnek kütle çapı 30 dan büyükse, örnekleme dağılımı z dağılımına uygundur. Eğer anakütle standart sapması bilinmiyor ve anakütle dağılımı normale yakınsa ve örnek kütle çapı 30 dan küçükse, örnekleme dağılımı t dağılımına uygundur.
Anakütle Ortalaması için güven aralığı Anakütle ortalaması için % 95 CI Anakütle ortalaması için % 99 CI CI: Confidence Interval (Güven Aralığı)
Güven aralığı limitleri 12.86 ile 15.14 arasındadır. 49 kişi üzerinde yapılan bir araştırmada yaş ortalaması 14 ve standart sapmasının da 4 olduğu bulunmuştur. %95 olasılıkla Anakütle ortalaması kaçtır? Güven aralığı limitleri 12.86 ile 15.14 arasındadır.
Anakütle oranı için güven aralığı Bir mahalleden tesadüfi olarak seçilmiş 144 seçmenin %20’sinin X partisini desteklediği görülmüştir. Mahalledeki X partili saçmen sayısı oranı %95 ihtimalle hangi aralıkta yer alır?
Örnek çapını belirleyen 3 faktör: Seçilen güven düzeyi İzin verilen maksimum hata Anakütledeki değişim
Örnek çapının hesaplanması E İzin verilen hata z seçilen güven düzeyine karşılık gelen z değeri s pilot araştırmanın örnek standart sapması
Bir firmanın halkla ilişkiler departmanı yeni ürettikleri ürün ile ilgili şikayetlerin ortalama 70 gün içinde geldiğini ve standart sapmanın da 20 gün olduğu bilmektedir. 5 günlük bir hata miktarını göze alarak %99 olasılıkla ortalama şikayet süresi tahmin edilmek istenirse ne kadar büyüklükte bir örnek çapı gerekir?
Elimizde olasılık değerleri varsa kullanılacak formül: p geçmişteki tecrübelere veya pilot çalışmaya göre kestirilen olasılık değeri Z seçilen güven düzeyine karşılık gelen z değeri E Araştırmacının tolerans gösterebileceği maksimum hata
Televizyonda Ana Haber bülteninin izlenme olasılığının %90 olduğu önceki çalışmalardan bilinmektedir. Ana Haber bülteni ile ilgili bir izleyici araştırması yapabilmek için Kestirimimizi anakütle oranına göre %3 yanılma payı ile hesaplamayı kabul ederek, %95 güven düzeyinde kaç kişilik bir örnek kütle seçmek gerektiğini hesaplayınız.
Birinci Adım: Örnek çapını önceden yaptığınız gibi hesaplayın. Eğer anakütlede örnek çapı hesaplamasının gerektirdiğinden daha az denek olursa ne yapacağız? Birinci Adım: Örnek çapını önceden yaptığınız gibi hesaplayın. no İkinci Adım: Yeni örnek çapını hesaplayın. n = no N 1 + no birinci adımda hesaplanan örnek çapı. N anakütle çapı.
Bir araştırmacı bir üniversitedeki öğretim üyelerinin sigara içme yasağına uyup uymadığını araştırmak istemektedir. Araştırmacı, insanların %80’inin sigara yasağına uyduklarını söyleyeceğini beklemektedir. Üniversitede 200 öğretim üyesi bulunmaktadır. Araştırmacı sonuçlardan %95 emin olmak istemektedir. Hata marjının da %3 ten fazla olmamasını istemektedir. Araştırma için kaç öğretim üyesi ile görüşülmelidir?
Birinci Adım İkinci Adım no n = 1 + Örnek çapını önceden yaptığınız gibi hesaplayın. 2 1.96 .03 = (.80)(.20) = 711 İkinci Adım Yeni örnek çapını hesaplayın. no 711 n = = = 156 711 200 1 + no N 1 +
Örnek kütleden alınan delillere ve olasılık teorisine dayanarak Hipotez Testleri Örnek kütleden alınan delillere ve olasılık teorisine dayanarak ya bir hipotezin doğru bir ifade olduğunu ve reddedilmemesi gerektiğini veya doğru bir ifade olmadığını ve reddedilmesi gerektiğini belirlemek için yapılan testlerdir.
Adım 1: Sıfır ve alternatif hipotezleri belirleyin Adım 2: Anlam Düzeyini belirleyin Adım 3: Test istatistiğini belirleyin (t, z, F gibi) Adım 4: Bir karar kuralı belirleyin (kritik değer) Adım 5: Bir örnek kütle belirleyin, bir karara varın H0 hipotezini reddetme H0 hip. reddet ve H1 hip. kabul et
Anakütle parametresi hakkında bir ifade Hipotezler H0 hipotezi Anakütle parametresi hakkında bir ifade Alternatif hipotez H1: Örnek kütlenin, sıfır hipotezin yanlış olduğuna dair delil sağlaması durumunda kabul edilen ifade Anlam düzeyi Gerçekte doğru olan sıfır hipotezinin reddedilme olasılığı; yani bunun riski.
Hiptezler üç farklı şekilde kurulabilir. H0: m = 50 H1: m ≠ 50 Hiptezler üç farklı şekilde kurulabilir. Sıfır hipotezinde daima eşitlik sözkonusudur. H0: m < 50 H1: m > 50 H0: m > 50 H1: m < 50
Risk Tablosu Araştırmacı Sıfır Kabul Red Hipotezi Ho Ho Ho doğru Ho yanlış Doğru karar Tip I hatası (a) Tip II Hatası (b)
Sıfır hipotezinin doğru olduğu kabul edildiğinde, en az test için hesaplanan değer (kritik değer) kadar büyük bir değer bulma olasılığıdır. p-Değeri Karar Kuralı Eğer p-değeri, anlamlılık düzeyi olan a dan daha büyük ise H0 reddedilmez. Eğer p-değeri anlamlılık düzeyi olan a dan daha küçükse ya da ona eşitse H0 reddedilir.
P değerlerinin anlamları Ho‘ın doğru olmadığına dair BAZI deliller var. Ho‘ın doğru olmadığına dair GÜÇLÜ deliller var. Ho‘ın doğru olmadığına dair ÇOK GÜÇLÜ deliller var.