Örnekleme Yöntemleri
Örneklem seçme neyin gözlenip neyin gözlenmeyeceğine karar verme sürecidir
SEÇİM SONUÇLARI 50 Kamuoyu Oy yüzdesi (%) Araştırma Şirketi AKP CHP MHP BDP Sonar 51 26 12 5 Konsensus 49 28 6 Pollmark 47 25 13 7 Genar Andy-Ar 52 27 11 Konda SEÇİM SONUÇLARI 50
50 milyon? 10 milyon? 1 milyon? 100 bin? Genellikle yaklaşık 2 bin! Kamuoyu araştırma şirketleri seçimler öncesi gerçek seçim sonuçlarına çok yakın tahminler yayınladılar Türkiye’de 50 milyon seçmenin oy verme davranışını doğruya yakın tahmin etmek için bu şirketler acaba kaç kişiyle görüşmüş olabilir? 50 milyon? 10 milyon? 1 milyon? 100 bin? Genellikle yaklaşık 2 bin! Peki, sadece 2 bin kişiyle görüşerek 50-100 milyon seçmenin seçimde nasıl oy kullanacaklarını nasıl tahmin ediyorlar?
Evren Evren, araştırma sonuçlarının geçerli olacağı büyük grup. Evren birimi, evrenin sınırlandırılmış bir parçasıdır. Liselerdeki disiplin suçları konusundaki bir araştırmanın evren birimi, liseler’dir.
Evren, Örneklem, Denek Evren 82 93 97 62 75 52 91 78 81 43 40 92 66 48 53 90 57 80 98 38 81 91 78 55 94 61 81 60 48 92 45 78 84 78 33 79 61 65 65 51 78 90 83 83 87 91 93 35 61 91 61 81 60 79 61 65 91 93 35 Örneklem Denek
Evren İki tür evren vardır; Hedef evren, araştırmacının ulaşmak istediği, ancak ulaşması güç olan ve ideal seçimini yansıtan soyut evrendir. Türkiye’deki tüm lise öğrencileri Ulaşılabilir evren, araştırmacının ulaşabileceği, gerçekçi seçimi olan somut evrendir. İstanbul’daki lise öğrencileri Raporlarda genelde ulaşılabilir evren tanımlanır.
Örneklem ve Örnekleme Örneklem, özellikleri hakkında bilgi toplamak için çalışılan evrenden çalışmak için seçilen evrenin sınırlı bir parçasıdır. Örnekleme, evrenden örneklem için birim çekme işlemine denir.
Parametre, İstatistik Evren Parametre(Evren Değer): Verilen bir değişkenin evrendeki özet tanımı (değeri) (örneğin, Türkiye’de ortalama yaşam süresi 73,8 yıl) İstatistik (Örneklem Değer): Bir değişkenin örneklemdeki değerini özetleyen tanım Örneklem istatistiği evren parametresini tahmin etmek için kullanılır Örneklem 82 93 97 62 75 52 91 78 81 43 40 92 66 48 53 90 57 80 98 38 81 91 78 55 94 61 81 60 48 92 45 78 84 78 33 79 61 65 65 51 78 90 83 83 87 91 93 35 61 91 61 81 60 79 61 65 91 93 35 Ortalama: 71,76 Ortalama: 69,56 Evren parametresi Örneklem istatistiği
İstatistikler evren parametresine ne kadar yakınsa o kadar iyi Aynı evrenden seçilen farklı örneklemler farklı örneklem istatistikleri (aritmetik ortalama, varyans, standart sapma) üretir İstatistikler evren parametresine ne kadar yakınsa o kadar iyi Bir evrenden alınabilecek tüm örneklemlerin ortalaması evren ortalamasına (71,76) eşittir. Örneklemler 82 93 97 62 75 52 91 78 81 43 40 92 66 48 53 90 57 80 98 38 81 91 78 55 94 61 81 60 48 92 45 78 84 78 33 79 61 65 65 51 78 90 83 83 87 91 93 35 61 91 61 81 60 79 61 65 91 93 35 Ortalama: 71,76 St. Sapma: 18,66 Ort: 69,56 43 38 92 51 91 Ort: 51,2 82 93 97 62 40 92 66 48 81 91 78 55 Ort: 73,75 Kaynak: Field ve Hole, 2008, s. 132-134
Örneklem ve Örnekleme Evrenden örneklemi oluşturmada temel alınan birime, örnekleme birimi denir. Örnekleme birimi eleman ise süreç eleman örnekleme, grup ise küme örnekleme olarak isimlendirilir. Örn: Liselerdeki disiplin suçları araştırırken; okul listesinden okullar seçilirse küme örnekleme, öğrenci listesinden öğrenci seçilirse eleman örnekleme
Evren, örnekleme, örneklem ve tahmin
Örnekleme Yöntemlerinin Sınıflandırılması Seçkisizlik (Randomization), örneklemede temel alınan birimlerin örneklem için seçilme olasılıklarının eşit olmasıdır. Bu ilke, birimlerin örnekleme seçilme durumlarının birbirinden bağımsız olmasıyla da ilgilidir.
Örnekleme Yöntemlerinin Gruplandırılması Seçkisiz örnekleme yöntemleri (Random sampling), evrenden örneklem için birim çekme işleminin seçkisizlik ilkesine uygun olarak yapılması Seçkisiz olmayan örnekleme yöntemleri (Non-random sampling), örnekleme alınacak birimlerin seçkisizlik ilkesine bağlı olmaksızın belirlenmesi
Örnekleme Yöntemleri Bilimsel Araştırma Yöntemleri Şener Büyüköztürk, Ebru Kılıç Çakmak, Özcan Erkan Akgün, Şirin Karadeniz, Funda Demirel
Basit Seçkisiz Örnekleme Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir
Tabakalı Örnekleme Evrendeki alt grupların evrendeki ağırlıkları oranında örneklemde temsil edilmelerini amaçlar. Alt evrenlerden birim çekme işlemi basit yansız örnekleme ile gerçekleştirilir.
Seçkisiz Olmayan Örnekleme Yöntemleri
Sistematik Örnekleme Birimlerin belli bir sistematik izlenerek bulunan bir aralık ve başlangıç noktasına dayalı olarak örnekleme seçilmesidir. Örn: Evren birimi Lise ve sayısı 200, seçilecek lise sayısı 20 ise k aralık genişliği 200 / 20 = 10 1- 10 arası rakamlardan biri kur’a ile belirlenir örneğin 8 olsun Buna göre örnekleme seçilecek liseler; 8, 18, 28, ... 198. sıradaki liseler olur.
Amaçlı Örnekleme Derinlemesine araştırma yapabilmek amacıyla çalışmanın amacı bağlamında bilgi açısından zengin durumların seçilmesidir. 6 amaçlı örnekleme yöntemi vardır; Aykırı durum Tipik durum Maksimum çeşitlilik Tabakalı amaçsal Benzeşik Ölçüt
Amaçlı Örnekleme Aykırı durum örnekleme Örneklemin problemle ilgili olarak birbirine aykırı (uç) durumlardan, örneklerden oluşturulmasıdır. Örn: Örneklemdeki okulların, en yüksek ve en düşük başarı düzeyindeki okullardan seçilmesi
Amaçlı Örnekleme Maksimum çeşitlilik örnekleme Örneklemin problemle ilgili olarak kendi içinde benzeşik farklı durumlardan oluşturulmasıdır. Örn: farklı sosyo-ekonomik düzeydeki okullar
Amaçlı Örnekleme Benzeşik örnekleme Örneklemin, araştırmanın problemiyle ilgili olarak evrende yer alan benzeşik bir alt grubundan ya da durumundan oluşturulmasıdır. Örn: Alt sosyo-ekonomik düzeydeki okullar
Amaçlı Örnekleme Tipik durum örnekleme Örneklemin araştırma problemi ile ilgili olarak evrende yer alan çok sayıdaki durumdan tipik olan biriyle oluşturulmasıdır. Sıra dışı olmayan, ortalama, tipik bir durum seçimi. Örn: Şehir merkezinde görece geneli yansıtabilecek birkaç okulun seçimi
Amaçlı Örnekleme Ölçüt örnekleme Örneklemin problemle ilgili olarak belirlenen niteliklere sahip kişiler, olaylar, nesneler ya da durumlardan oluşturulmasıdır. Örn: Liselerdeki şiddet davranışlarını konu alan bir araştırmada örneklem belirlerken, resmi kayıtlara göre en az 2 olaya karışma durumu bir ölçüt olabilir. Okul yöneticileri içerisinde motivasyonu en düşük %10’luk grubun seçilerek bir uygulama yapılması.
Amaçlı Örnekleme Tabakalı amaçsal örnekleme Örneklemin ilgilenilen belli alt grupların özelliklerini göstermek, betimlemek ve bunlar arasında karşılaştırmalar yapabilmek amacıyla bu alt gruplardan oluşturulmasıdır. Kota örnekleme olarak da anılır.
Seçkisiz Olmayan Örnekleme Yöntemleri Bilimsel Araştırma Yöntemleri Şener Büyüköztürk, Ebru Kılıç Çakmak, Özcan Erkan Akgün, Şirin Karadeniz, Funda Demirel
Uygun Örnekleme Örn: Kolay uygulama yapılabilecek liseleri seçme... Zaman, para ve işgücü açısından var olan sınırlılıklar nedeniyle örneklemin kolay ulaşılabilir ve uygulama yapılabilir birimlerden seçilmesidir. Örn: Kolay uygulama yapılabilecek liseleri seçme...
Örneklem Büyüklüğü Nicel araştırmalarda incelenen değişkenin sürekli ve süreksiz olmasına göre farklı formüller kullanılarak hesaplanır. Nitel araştırmalarda ise örneklem büyüklüğünü hesaplamada belli bir kural yoktur. Araştırmanın amacına ve sahip olunan olanaklara göre kararlaştırılır.
Temel kavramlar Anlam ve Güven düzeyi α nın saptanması Her teste bir miktar hata vardır. Bu 0,05 ; 0,01 ; 0,005 ; 0,0001;... gibi bir düzey olarak benimsenebilir. Yanılma payımız küçüldükçe, teste olan güven düzeyimiz yükselir. Yine de α =0,05 ve α = 0,01 düzeyleri en çok kullanılanlardır. α=0,05 ise testin güven düzeyi 1 - α = 0,95 olur.
Temel kavramlar Sapma Miktarı (d) Araştırmada evrenin özelliğine ilişkin yapılacak tahminle ilgili tolere edilmek istenen aralık genişliğini (doğruluk derecesini) tanımlar. Evren için yapılacak ortalama tahminin, evrenin gerçek değerinden 100’lük puan sisteminde +- 5 puanlık farklı tolere edilecekse Sapma (hoşgörü) miktarı .05 olur.
Temel kavramlar Ortalama Bir dağılımın orta noktasını gösteren ve dağılımı temsil eden bir ölçüdür. Ancak aritmetik ortalama dağılımın yaygınlığı hakkında bilgi veremez Örneğin; 10,22,34 değerlerini alan 3 kişilik bir dağılımda aritmetik ortalama 66/3=22’dir. 21,23,22 değerlerini alan başka bir 3 kişilik dağılımda aritmetik ortalama yine 66/3=22’dir.
Temel kavramlar Standart sapma Standart sapma dağılımdaki her bir değerin ortalamaya göre ne uzaklıkta olduğunu, diğer bir deyişle dağılımın ne yaygınlıkta olduğunu gösteren bir ölçüdür. Standart sapma büyüdükçe dağılım yaygınlaşır. Genel olarak, standart sapmanın küçük olması; ortalamadan sapmaların ve riskin az olduğunun, büyük olması ise; ortalamadan sapmaların, riskin çok olduğunun ve oynaklığın göstergesidir.
Standart Sapma Formülü SS : Standart sapma Xi : i’nci ölçüm değeri : n sayıda ölçümün ortalaması n : Ölçüm sayısı
Temel kavramlar Varyans Varyans kavramı dağılıma ait her bir değerin, dağılımın ortalamasından ne kadar uzak olduğuyla ilgilidir. Varyans söz konusu sapmaların ortalama değerini ölçmektedir. Varyansın karekökü standart sapmadır Varyans bir dağılımın, kendi ortalamasından sapmasının karesinin beklenen değeridir.
Temel kavramlar = 1.67 (3 – 2.5)2 + (4 – 2.5)2 ] / (4 - 1) Varyans formülü Örn: 1, 2, 3, 4 dağılımında ortalama = 2.5 Var = [ (1 – 2.5)2 + (2 – 2.5)2 + (3 – 2.5)2 + (4 – 2.5)2 ] / (4 - 1) = 1.67 Varyansın kakekök değeri = 1.29 standart sapma Varyans bir dağılımın, kendi ortalamasından sapmasının karesinin beklenen değeridir.
Normal Dağılım Standart normal dağılım ortalama değeri 0 ve standart sapması 1 olan normal dağılım ailesinin tek bir elemanıdır. Bu olasılık fonksiyonunun grafik şekli bir çan gibi görüntü verdiği için çoğu kez çan eğrisi olarak da anılır. Aritmetik ortalama: Deneklerin aldıkları değerlerin toplanıp denek sayısına bölünmesiyle elde edilen değerdir. Ortanca: Bir ölçek üzerinde orta noktanın yerini gösteren bu ölçü tüm değerleri ortadan ikiye bölen değerdir. Mod: Ölçümlerde en fazla tekrar edilen değere mod denir. Ranj: En büyük ölçümle en küçük ölçüm arasındaki farktır. Standart sapma: Ölçümlerin ortalamadan olan farklarının karelerinin ortalamasının kareköküdür. Standart hata: Aritmetik ortalamada oluşan hatanın belirlenmesi için bulunur.
Normal Dağılım Dağılımın %50’si sağda, %50’si soldadır. Koyu mavi ortalamadan bir standart sapma daha küçüktür. Bir normal dağılım için bu (koyu mavi) eğrinin altında kalan alan, toplam alanın %68'ini kapsar. Ortalamadan iki standart sapma aralığında noktalar için eğrinin altında kalan alan (orta ve koyu mavi alan) toplam alanın %95.4’ünü kapsar. Ortalamadan üç standart sapma aralığında noktalar için eğrinin altında kalan alan (açık, orta ve koyu mavi alan) toplam alanın %99.7sini kapsar.
Tahmini Örneklem Büyüklüğü Tablo: Belli evren büyüklükleri için tahmini örneklem büyüklüğü (Alfa=.05)
Örneklem Büyüklüğü İçin Dikkat Edilmesi Gereken Noktalar Birçok araştırma için 30’dan büyük ve 500’den küçük olan örneklem büyüklükleri uygundur. Örneklemler daha alt örneklemlere bölünebildiğinde (erkek / kadın, tecrübeli / tecrübesiz, vb.) her kategoriden en az 30 eleman genişliğinde örneklem büyüklüğünü seçmek gereklidir. Roscoe (1975)
Örneklem Büyüklüğü İçin Dikkat Edilmesi Gereken Noktalar Çok değişkenli bir araştırmada (çoklu regresyon analizleri dahil olmak üzere), örneklem büyüklüğü çalışmadaki değişken sayısının tercihen 10 katı veya daha fazla olmalıdır. Sıkı deneysel kontrol (eşlenmiş çiftler, vb.) altındaki basit bir deneysel araştırma için 10-20 kadar küçük bir örneklem genişliği başarılı bir araştırmayı mümkün kılabilir. Roscoe (1975)
Sigara İçme - Akciğer Kanseri İlişkisi – I Araştırma sorusu: “Sigara içme alışkanlığıyla akciğer kanserine yakalanma arasında bir ilişki var mıdır?” Kaç akciğer kanserli vaka olduğu, yüzde kaçının sigara içtikleri bilinmiyor Kanserli vakaların %90’ı geçmişte sigara içmiş %95 güvenle sigara içmekle akciğer kanseri arasında %90 ilişki vardır denebilir (±%2,5; yani ±2 SH; güven aralığı: %87,5-%92,5) Araştırma I Örneklem büyüklüğü = 1600 Örneklem istatistiği: %90 Standart Hata: %1,25 %87,5 %90 %92,5
Sigara İçme - Akciğer Kanseri İlişkisi – II Araştırma sorusu: “Sigara içme alışkanlığıyla akciğer kanserine yakalanma arasında bir ilişki var mıdır?” Kanserli vakaların %85’i geçmişte sigara içmiş %95 güvenle sigara içmekle akciğer kanseri arasında %85 ilişki vardır denebilir (±%5; yani ±2 SH; güven aralığı: %80-%90) Araştırma II Örneklem büyüklüğü = 400 Örneklem istatistiği: %85 Standart Hata: %2,5 %80 %85 %90
Sigara İçme - Akciğer Kanseri İlişkisi – III Araştırma sorusu: “Sigara içme alışkanlığıyla akciğer kanserine yakalanma arasında bir ilişki var mıdır?” Kanserli vakaların %88’i geçmişte sigara içmiş %95 güvenle sigara içmekle akciğer kanseri arasında %88 ilişki vardır denebilir (±%2,5; yani ±2 SH; güven aralığı: %85,5-%90,5) Araştırma III Örneklem büyüklüğü = 1600 Örneklem istatistiği: %88 Standart Hata: %1,25 %85,5 %88 %90,5
Sonuç Diyelim ki evren parametresini bilmiyoruz. Yani gerçekte bütün sigara içenlerin kaçta kaçı kansere yakalanıyor bilmiyoruz. Belki hiçbir zaman da bilemeyeceğiz. Farklı araştırmalarda ilişkinin %90’lar civarında olduğu tekrar tekrar ortaya çıkacak. Belki, nadir de olsa, bazı örneklemlerde sigara içmeyle kanser arasında ilişki bulunamayacak. O zaman örneklem istatistiğini evren parametresi olarak kabul etsek ve ikisi arasında %90 ilişki vardır desek ne kadar yanılabiliriz? %5?.. %3?.. %2?... Sigara içme ile akciğer kanseri arasındaki ilişkinin %90, %85, %88 olması FARKEDER Mİ?! %87,5 %90 %92,5