FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ
GİRİŞ Önceki bölümlerde saha çalışmlarında toplanan verilerin analize hazır hale getirlmesi ve nicel analiz tekniklerinin sınıflandırılması üzerinde durulmuştu. Amaçlar açısından analiz tekniklerini, farklılıkları incelemeye ve ilişkileri incelemeye yönelik teknikler olmak üzere iki kategori altında toplayabiliriz. Bu derste farklılıkları incelemeye yarayan analiz tekniklerini ve örnek spss uygulamalarını göreceğiz.
FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ Bu derste söz konusu amaçlar doğrultusunda yaygın olarak kullanılan çeşitli istatiksel analiz tekniklerinin amacı,uygulanabilme şartları,varsayımları ve sonuçlarının yorumlanması üzerinde durulacaktır.
FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ Farklılıkların incelenmesine yöneliz analiz tekniklerini,amaca bağlı olarak,üç genel kategori altında toplamak mümkündür.
Farklılıkların incelenmesine yönelik analiz tekniklerini, amaca bağlı olarak üç genel kategori altında toplamak mümkündür. Farklılıkları İncelemeye Yönelik İstatistik Analiz Teknikleri Tek Grup Karşılaştırması İki Grup arası Karşılaştırması İkiden Fazla Grup Arası Karşılaştırma
FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ Tek Grup Karşılaştırması Testi; ..Ölçülen (gözlemlenen) değer ile beklenen (öngörülen) bir değer arasında bir farkın olup olmadığının incelenmesine yönelik analiz tekniğidir. .. Örneğin; bir üretim işletmesinde hatalı parça sayısının %2 olduğu yönündeki bir iddianın (hipotezin) test edilmesi bu tür analizlere iyi bir örnektir.
2. İki Grup arası Karşılaştırması FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ 2. İki Grup arası Karşılaştırması Bu teknikler karşılaştırma yapılan iki grup arasında bir ilişkinin olup olmamasına veya grupların birbirinden bağımsız olmasına bağlı olarak iki ayrı teknik söz konusudur.
FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ A- Bağımsız iki grup testi (independent samples t-test); Birbirinden bağımsız iki grup arasındaki farklılıkların incelenmesine yönelik testtir. Örnek; Bir araştırmacının sendikaya üye olan ve üye olmayan işçilerin aldıkları maaşlar arasında anlamlı bir farın olup olmadığını araştırması
FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ B- İlişkili iki grup arasındaki test (paired-samples t-test); Birbiri ile ilişkili iki grup arasındaki test tekniğidir. Örnek; Bir süper market yöneticisi, bir grup müşterinin iki farklı promosyon kampanyasına karşı sergiledikleri tutum ve davranışlar arasında anlamlı bir farkın olup-olmadığının araştırılması,
FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ Üçüncü grup analiz teknikleri ise, İkiden fazla grup arasında karşılaştırmaların yapıldığı veya farklılıkların incelenmesine yönelik olan analiz teknikleri olup, ANOVA, One-way ANOVA ve ki-kare teknikleri yaygın olarak kullanılanlar arasındadır
Farklılıkları İncelemeye Yönelik İstatistik Teknikleri Bunun yanında,veri özelliklerine bağlı olarak,farklılıkları incelemeye yönelik analiz tekniklerini sınıflandırırsak, Farklılıkları İncelemeye Yönelik İstatistik Teknikleri Parametrik Analiz Teknikleri Tek grup t-testi İki bağımsız grup t-testi İlişkili grup t-testi ANOVA ve One Way ANOVA Parametrik Olmayan Analiz Teknikleri Mann Whitney U testi İşaret testi Wilcoxon işaret testi Wald Wolfovitz sıra testi Kolmogorov Smirov (K-S) testi Kruskal-Wallis Testi
PARAMETRİK ANALİZ TEKNİKLERİ T- Testi Örnek boyut küçüldükçe t-dağılımı normal dağılıma daha çok benzemeye başlar ve hatta örnek boyutu 100’ün üzerinde çıktığında ikisi (t ve z dağılımları) arasındaki farkı görmek zorlaşmaktadır. T testi, örnek boyutunun küçük olduğu ve evren( (ana kitleye) ait standart sapmaların bilinemediği durumlarda t-dağılımından yararlanarak;
Hipotez testlerinde en yaygın olarak kullanılan yöntemdir. PARAMETRİK TESTLER T-TESTİ Hipotez testlerinde en yaygın olarak kullanılan yöntemdir. T testi ile iki grubun ortalamaları karşılaştırılarak, aradaki farkın rastlantısal mı, yoksa istatistiksel olarak anlamlı mı olduğuna karar verilir . Küçük örneklemlerle de çalışmaya imkan verdiğinden, araştırmacılar için büyük kolaylık sağlamaktadır.
İncelenen bir değişken açısından bir gruba ait ortalama değerin önceden belirlenen(öngörülen) değerden farklı olup olmadığının, İncelenen bir değişken açısından bağımsız iki grup arasında anlamlı farkın olup olmadığının İncelenen bir değişken açısından herhangi bir grubun farklı şartlar dürtüler altındaki tepkileri arasında anlamlı farklılığın olup olmadığının incelenmesine yönelik hipotezleri test etmeye çalışan bir analiz yöntemidir.
Bu noktadan hareketle,üç tür t-testinden bahsetmek mümkündür. Tek grup t-testi( one-sample t-test) Bağımsız iki grup arası farkların testi (independent samples t- test Eşleştirilmiş iki grup( paired samples t-test) arasındaki farklılıkların incelenmesine yönelik t-test
Tek grup "t"-Testi (one-sample test) Bu test genellikle herhangi bir konuda belirli öngörülerde bulunulduğunda bu öngörünün doğruluk derecesini test etmek amacıyla uygulanır. Örnek: - A okulunda çalışan 100 personelin yaş ortalamasının 37 olduğu biliniyor. Rastgele seçilen 10 kişilik örneklemin yaş ortalaması 37'den farklı mıdır? - Bir üniversitede okuyan öğrencilere günlük harcamalarının ne kadar olduğu soruluyor. Acaba öğrencilerin günlük harcamalarının ortalaması (öngörülen) 10 TL.den farklı mıdır?
Tek grup "t"-Testi (one-sample test) . Yukarıda SPSS çıktısı görülmektedir. Bu tablodaki analizleri yorumlarken tablonun sağ alt kısmında yer alan t-value (t-değeri), df (serbestlik derecesi) ve Significance (2- tailed) (iki-kuyruklu/yönlü anlamlılık) yazan kısma bakmak gereklidir. Bu kısımda Significance (2-tailed) kolonunda bulunan değer %5 anlamlılık düzeyi için 0.05ten veya %1 anlamlılık seviyesi için ise) 0,01 den küçük ise test edilen değer (null değeri) ile gözlenen değer arasında istatistiksel açıdan anlamlı bir farkın olduğu sonucu çıkarılır. Aksi halde, herhangi bir fark yoktur yorumu yapılacaktır
PARAMETRİK TESTLER Bu örnekte, araştırmacı %5 anlamlılık seviyesinde (veya %95 güven aralığında) atletlerin eğitim öncesinde 400 metrelik mesafeyi 120 saniyede koşabileceğini iddia etmektedir. Analiz sonuçlarına bakıldığında t değerinin 3.338 olduğu ve bunun da istatistiksel açıdan öngörülenden anlamlı bir derecede sapma olduğu sonucunu Sig. 2-taiIed. değerinin kritik değer olan 0.05'ten küçük olması sebebiyle anlıyoruz. Öngörüldüğü gibi atletlerin eğitim öncesi 400 m yi koşma süresi 120 saniyeden farklıdır. Ancak bu sonuç bize gerçek ortalama koşma süresinin ne olduğu hakkında fazla bir şey söylememektedir. Bunun için söz konusu değişkene ilişkin ortalama değere bakılması gerekir. (Ölçülen ortalama değer 132.46 olarak çıkmıştır).
PARAMETRİK TESTLER Bağımsız iki grup arası farkların testi (Independest Samples "t" test) Bir araştırmada çoğu kez farklı ana kütleden elde edilen gruplar arasında karşılaştırmalar yapmak gerekir. Örnekler: - Evli ve bekar öğretmenlerin aylık harcamaları arasında anlamlı bir farklılık var mıdır? - Yönetici ve öğretmenlerin okullardaki çalışma ortamına ilişkin görüşleri arasında anlamlı bir farklılık var mıdır? - Yerli ve yabancı turistlerin müşteri tatminine ilişkin görüşleri arasında anlamlı bir farklılık var mıdır? .
Bir öğretmen eğitimin gündüz veya gece yapılmasının öğrenci performansı üzerinde etkili olup olmadığını incelemek istemektedir. Bu amaçla, I. ve II. öğretim öğrencilerinin başarıları arasında farkın olup olmadığını araştırmaktadır. %99 güven aralığında değerlendirme yapmak istemektedir. Bir belediye başkanı yapmış olduğu faaliyetlerin çeşitli gruplarca nasıl algılandığı konusunda araştırma yaptırmaktadır. Bu bağlamda başkan bir birinden farklı sosyal yapı ve politik görüşe sahip iki mahalle arasında verilen hizmetleri algılama açısından bir fark var mıdır sorusuna cevap aramaktadır.
İstatistik paketlerinde varyânsların eşit olup olmadığını test eden çeşitli yöntemler yer almaktadır. Bu amaçla, SPSS programında: F testi veya Levene testi'nderi yararlanılmaktadır. Varyanslann eşitliği durumunda iki gruba ait varyans birleştirilir. Aksi taktirde ayrı ayrı varyans hesaplamasına gidilir. SPSS'te her iki durum için de hesaplama yapılmakta ve analiz çıktılarında verilmektedir. Sonuçların değerlendirilmesinde Levene testine bağlı olarak yorum yapmak gerekmektedir.
PARAMETRİK TESTLER Bağımsız iki grubun karşılaştırıldığı t'testinin hesaplanmasında gruplar arasında varyans farkının olup olmadığına dikkat edilmesi gerekmektedir. Karşılaştırılan grupların varyanslarının eşit olup olmamasına bağlı olarak iki farklı hesaplama yapılmaktadır. Bu sebeple, t-testi hesaplamalarında öncelikle varyansların eşit olup olmadığının test edilmesi gerekmektedir.
PARAMETRİK TESTLER 400 metre koşusunda bayanlarla erkekler arasındaki farkın varlığı araştırılmaktadır. Levene testi anlamlılık düzeyi Sig. 0,05 kritik değerinin altındadır.(0,000).Buradan iki grubun varyanslarının farklı olduğu anlaşılır. Farklı varyanslar olduğundan ‘’Unequal variance not assument’’ satırındaki değer dikkate alınır.(2,537).Buna karşılık gelen Sig. Değeri esastır.(0,015)Bu da 0,05 ten küçük olduğu için bayanlarla erkekler arasında 400 metre koşma konusunda farklılık vardır denir.
PARAMETRİK TESTLER Eşleştirilmiş İki Grup Arasındaki Farkların Testi Bağımsız iki grup arası karşılaştırmada grupların (örneklerin) birbirinden bağımsız evrenlerden geldiği varsayımından hareket edilmekte idi. Ancak, özellikle kontrollü veya deneysel çalışmalarda (örneğin, bir mamul için geliştirilen iki farklı reklamın deneklerce nasıl algılandığı veya hangi reklamın daha çok beğenildiğinin tespiti) aynı deneklerin farklı durumlar altında sergiledikleri davranışlar ve algılarının incelenmesi arzu edilebilir.
Eşleştirilmiş Grup t-testi Örnekleri' PARAMETRİK TESTLER Eşleştirilmiş Grup t-testi Örnekleri' -Öğrencilerinin sabah ve öğleden sonraki sınav performanslarını incelemek isteyen bir öğretmenin bir grup öğrencisini hem sabah ve hem de öğleden sonra sınava alarak sınav zamanının öğrenci performansı üzerindeki etkisinin olup olmadığını incelemektedir. Bir firma yönetici, işçilerinin Pazartesi ve Çarşamba günkü performanslarını karşılaştırmak istemektedir. İki günkü performans arasında iddia edildiği gibi bir farkın olmadığına inanmaktadır. Bu yöneticinin düşüncesi doğru mu, yoksa yanlış mıdır? Bir supermarket yöneticisi bir grup müşterinin iki farklı promosyon kampanyasına karşı sergiledikleri tutum ve davranışlar arasında anlamlı bir farkın olup olmadığını araştırmaktadır.
PARAMETRİK TESTLER -Bir araştırmacı anketörlerin saha çalışmaları sırasında katılımcıları etkileyip etkilemediğini merak etmektedir. Bu sebeple gönüllü olarak seçilen 30 kişiye iki farklı anketör tarafından sorular yöneltilmektedir. Deneklerin iki anketöre vermiş oldukları cevaplarının arasında farklılık var mıdır? -Bir pazarlama müdürü yürütülmekte olan reklam kampanyasının etkili olup olmadığını araştırmaktadır. Bu amaçla müşterilerin firma mamullerine karşı reklam öncesi ve reklam sonrası tutumları arasında bir değişmenin olup olmadığını merak etmektedir.
PARAMETRİK TESTLER Mean N Std. Deviation Std, Error Mean Pair 1 Eğitim öncesi 400 m kosu süres: 132,46 50 26,396 3,733 Eğitim sonrası 400 m koşu süresi 105,24 12,984 •1,635 Paired Differences 95% Confidence Interval of the Difference t Df Sig. <2- tailed) Mean Std. Deviation Std. Error Mean Lower Upper Pair1 Eğitim öncesi 400 m koşu süresi - Eğitim sonrası 400 m koşu süresi 27,22 20,734 2,932 21,33 33,11 S,283 49 .000 Araştırmacı bir atletizm takımında yer alacak atletlerin seçiminde 50 kişilik bir kadro içinden seçim yapmaktadır. Bu 50 aday önce 400 metre koşusuna tabi tutulur ve koşma süresi kaydedilir. Ardından 15 günlük bir özel eğitimle atletlerin performanslarının geliştirilmesi izlenmeye çalışılmaktadır. Araştırmacı uygulanan eğitimin etkin olup olmadığını görmek istemektedir ve önce-sonra anlamlı farkı araştırmaktadır.
PARAMETRİK TESTLER Mean N Std. Deviation Std, Error Mean Pair 1 Eğitim öncesi 400 m kosu süres: 132,46 50 26,396 3,733 Eğitim sonrası 400 m koşu süresi 105,24 12,984 •1,635 Paired Differences 95%Confidence Interval of the Difference t Df Sig. (2- tailed) Mean Std. Deviation Std. Error Mean Lower Upper Pair1 Eğitim öncesi 400 m koşu süresi – Eğitim sonrası 400 m koşu süresi 27,22 20,734 2,932 21,33 33,11 9,283 49 .000 Tabloya göre eğitim öncesi ve sonrası performanslar arasında ortalama 27,22 saniyelik bir farkın olduğu gözlenmektedir. Bu farka tekabül eden t değeri ise 9,263 tür. Bu değere karşılık anlamlılık düzeyi Sig. (2-tailed) değeri 0.000 olduğundan verilen eğitim son derece etkili olmuştur ve atletlerin eğitim öncesi ve sonrası performansları arasında anlamlı bir fark vardır yorumu yapılacaktır.
PARAMETRİK TESTLER Mean N Std. Deviation Std, Error Mean Pair 1 Eğitim öncesi 400 m kosu süres: 132,46 50 26,396 3,733 Eğitim sonrası 400 m koşu süresi 105,24 12,984 •1,635 Paired Differences 95% Confidence Interval of the Difference t Df Sig.2- tailed) Mean Std. Deviation Std. Error Mean Lower Upper Pair1 Eğitim öncesi 400 m koşu süresi - Eğitim sonrası 400 m koşu süresi 27,22 20,734 2,932 21,33 33,11 9,283 49 .000 SONUÇ: Sig. (2-tailed) değeri (%5 anlamlılık düzeyinde) 0.05 değerinden çok küçük olduğu için null hipotezi olan "fark yoktur" ifadesi reddedilerek kişinin tepkisinin atletin eğitim öncesi ve sonrası performansı arasında anlamlı bir fark vardır.
PARAMETRİK TESTLER ANOVA ve One-Way ANOVA ‘Sosyal Bilimlerde özellikle psikolojide ve eğitim bilimlerinde yapılan deneysel çalışmaların çoğu, karışık desenlerde yürütülmektedir. Split-plot desenler olarak ta isimlendirilen bu tür çalışmalardan elde edilen verilerin analizinde sıklıkla kullanılan bir istatistiksel model, varyans analizidir.’’
PARAMETRİK TESTLER OneWay Anova Örnekleri 1. Bir yarışma programı sunucusu kelime bulma yarışmasında yarışmacılara bilinmeyen kelimenin ilk harfini söylemenin, son harfini söylemenin veya hiçbir harf söylememenin, yarışmacının kelimeyi bulma süresi üzerinde etkili olup olmadığını merak etmektedir. -Piyasaya yeni bir mamul sürmek üzere olan bir tüketici ürünleri firması dört farklı ambalaj arasında kararsızdır. Bunun için bir araştırma yaptırmıştır. Bu ambalajlar arasında tüketicilerce tercih ve beğenme açısından anlamlı farklılıklar var mıdır? -
Bir anketör ankette yer alan soruların sırasının ve yazım fontunun deneklerin cevaplarını etkilediği savını öne sürmektedir. Bu amaçla belli bir anketi iki ayrı fontta ve dört farklı soru düzeninde hazırlayarak 250 kişi üzerinde denemektedir. Anketör farklı soru sıra düzeninin cevaplar üzerinde etkili olup olmadığını incelemektedir. Bir işletme müdürü bir üretim hattında çıkan hatalı parça sayısının üç vardiya için farklı olduğunu iddia etmektedir.
PARAMETRİK TESTLER Bu durumlarda uygun test ANOVA (Analysis of Variance) testidir. Bu testin ön şartlarından biri bütün grupların normal dağılım sergileyen bir ana kitleden tesadüfi olarak seçilmiş örnekler olmasıdır. Bunun yanında bütün grupların varyanslarının birbirine eşit olması da istenmektedir.
ANOVA testi normal dağılım şartının ihlaline karşı hassasiyeti azdır. Ancak, ANOVA testi sonuçları, sadece, karşılaştırma yapılan gruplar (3 veya daha fazla sayıda olabilir) arasında herhangi bir farkın olup olmadığını göstermekle beraber, bu farklılığa sebep olan grubun hangi grup veya gruplardan kaynaklandığı konusunda herhangi bir bilgi vermemektedir.
Bu durumda OneWay Anova uygulamak gereklidir. One-way ANOVA testinde diyalog kutusunda bulunan Post Hoc -seçeneği altında çoklu mukayeselere imkan tanıyan çeşitli test istatistikleri bulunmaktadır. Burada en yaygın kullanılan ve yorumu en kolay olan Scheffe testi benimsenmiştir. Farklı şartlar altında listede verilen diğer testlerin kullanılması gerekebilir.
PARAMETRİK TESTLER ………………….. One-way ANOVA test çıktısı. Oneway ANOVA çıktılarında ANOVA testi sonuçlarına ilave olarak, grupların ikili karşılaştırılması yapılmaktadır ve (eğer gruplar arası fark varsa) gruplar arası farkın kaynağı konusunda bilgi sağlamaktadır. Ancak, Oneway ANOVA test sonuçları, gruplar arası farkın olmadığı sonucunu çıkarırsa, alt kısımda görülen gruplar arası karşılaştırma tabloda yer almaz .
PARAMETRİK TESTLER Burada eğitim yanında 2 farklı diyet uygulanmıştır.Kontrol grubu:Sadece eğitim,2.grup eğitim ve 1.diyet, 3.grup eğitim ve 2. diyet. Burada Anova(F testi) sonucu üst tabloda 12,373 e karşılık gelen sig.0,000 olduğundan kilo kaybı açıısndan anlamlı farklılık vardır. .
Parametrik testlerin uygulanabilmesi için bazı şartların sağlanması gerekliydi. Örneğin , bir diyetisyen , reklamı yapılmakta plan iki farklı diyet metodu arasında zayıflatma etkinliği açısından bir farkın olup olmadığını araştırmaktadır. Bu amaçla her iki diyet için5kg’lık bir zayıflama için gerekli süreyi ölçer. Ancak diyetisyen ölçüm neticesinde ortaya çıkan gerekli süre değerlerinin normal dağılımından uzak olduğunun Farkına varır.
Mann Whitney U Testi Wilcoxon testi olarak da bilinen bu test t- testinin parametrik olmayan eş değeri olarak düşünülebilir. Bu test için veri dağılımı konusunda herhangi bir şart olmamakla birlikte , verini tesadüfi olarak toplanmış olması ve sıralı olması yeterlidir. Analiz için verinin , aralık seviyesi olmaına gerek kalmaksızın , ordinal seviyede olması yeterli olmaktadır.
Bu test ile bağımsız iki grubun aynı dağılımı sahip ana kitlelerden geldiği hipotezi test edilmektedir. Şartlar sağlandığı sürece Mann Whitney U testi yerine t-testinin uygulanması daha doğru olacaktır. Çünkü t-testi daha güçlüdür.
İşaret Testi Bu test bağımlı gruplar arası farklılıkları ölçmeye yönelik olan t- testinin non-parametrik eşdeğeridir. Bu analiz ile , iki değişkenin dağılımları aynıdır hipotezi test edilmektedir. Bu test için herhangi bir veri dağılım şartı yoktur
Kolmogorov -Smirnov (K-S) Testi K-S testi tesadüfi olarak toplanmış olan bir örnek verinin belirli bir dağılıma uyup uymadığını incelemek için kullanılmaktadır. Prensip olarak bu test , örnek verinin kümülatif dağılım fonksiyonunun öne sürülen kümülatif dağılım fonksiyonuyla karşılaştırılması esasına dayanmaktadır. Bu test yardımıyla bir örneklemden toplanan verilerin normal dağılım sergileyip sergilemediğini incelemek mümkündür
Tek - Grup Ki - Kare Testi Bu test ile araştırılan olayla ilgili olarak gözlemlenen frekans değerinin belirli bir değerden farklı olup olmadığının incelenmesinde kullanılmaktadır. Bu analiz için tek şart , verini tesadüfi olarak toplanmış olması şartıdır
Friedman Testi İki veya daha fazla sayıdaki ilişkili örnek kitleyi karşılaştırmada kullanılmaktadır. Eşleştirilmiş gruplar t- testine benzemektedir. Testin yegane şartı ise her bir denek için k sayıdaki değişkenin 1’den k ‘ya kadar sıralanmış olmasıdır. Frıedman testi de ki-kare dağılımına benzer bir dağılım sergilemektedir
İki - Grup medyan Testi İki popülasyonun veya ana kitlenin aynı medyana sahip olup olmadıklarının testi için kullanılmaktadır. Analizin temelinde , her iki ana kitleye ait verilerin birleştirilerek genel bir medyan değerinin belirlenmesi ve ardından da medyan değerin altında ve üstünde kalan değerlerin oranlarının tespiti yapılmaktadır
İki Grup Wald Walfovitz Testi Bu test iki gruba ait örneklerin aynı dağılıma sahip ana kitlelerden gelip gelmediğinin testi için kullanılmaktadır. İki Grup Kolmogorov - Smirnov Testi Bu test iki örnek kitlenin aynı dağılıma sahip kitlelerden gelip gelmediğinin testi için kullanılmaktadır. İki grubun dağılımlarının karşılaştrılması esasına dayanılmaktadır.
TEŞEKKÜRLER