Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Yrd. Doç. Dr. İpek EROĞLU KOLAYİŞ

Benzer bir sunumlar


... konulu sunumlar: "Yrd. Doç. Dr. İpek EROĞLU KOLAYİŞ"— Sunum transkripti:

1 Yrd. Doç. Dr. İpek EROĞLU KOLAYİŞ
İSTATİSTİK Yrd. Doç. Dr. İpek EROĞLU KOLAYİŞ

2 TANIMLAR İstatistik: herhangi bir konuyu incelemek amacıyla çalışmanın planlamasını , verilerin toplanmasını, değerlendirilmesini ve bir karara varılmasını sağlayan bilimdir. Bir konunun incelenmesi çoğunlukla örneklemler üzerinde gerçekleşir ve elde edilen bulgular evrene genellenir. Tanımlayıcı istatistik Çıkarımsal istatistik

3 Evren: Belirli özelliğe sahip tüm bireylerin (gözlemlerin) oluşturduğu topluluktur.
Diğer bir değişle evren yapılması istenen araştırmanın amacına uygun olarak konu ile ilgili tüm bireylerin oluşturduğu topluluktur. Evren sayılabilir sonlulukta ya da sonsuz olabilir. Yani amaca bağlı olarak büyüyebilir veya küçülebilir. Örneklem: Çekildiği evreni temsil ettiği düşünülen ve evrene göre daha az sayıda birey ya da gözlemden oluşan alt kümedir

4 Örnekleme: Örnekleme kuramı, evrenden örnek seçmek amacıyla geliştirilen yöntemler üzerinde durur. Bu kuramın ön gördüğü kurallar yardımıyla evrenden örneklem seçme işine “örnekleme” denir. Parametre ve istatistik: Evreni tanımlamak için kullanılan ölçülere parametre, örneklemi tanımlamak için kullanılan ölçülere istatistik denir.

5 Örneklem Evren Tanımlayıcı Ölçüler (istatistik) (Parametre) _________________________________________ Ortalama X µ Oran p P Standart sapma S σ Varyans S  σ Standart Hata Sx σx Gözlem Sayısı n N

6 Değişken; Değişik değerler alan herhangi bir özelliğe değişken denir
Değişken; Değişik değerler alan herhangi bir özelliğe değişken denir.Boy uzunluğu, yaş vb. Veri; İncelenen konuya açıklık getirmek amacıyla toplanan bilgiler, belgeler, ölçümler, … vb.

7 Verinin Ölçüm Biçimi (Veri Tipi)
Nitelik veriler; Örneğin; az-çok, yeterli-yetersiz iki durumlu, üç durumlu veya daha çok olabilir Çoğunlukla yüzde ile özetlenir. Birden çok nitelik değişken arasında ilişkiyi gözlemek için çapraz tablo veya grafikler kullanılır. Sıralı nitelik veriler Kötü,orta, iyi, mükemmel Sayısal veriler - Kesikli sayısal veriler; Belirli bir alandaki tam sayılar - Sürekli Sayısal veriler; Ölçümle belirtilirler ve bir aralıktaki bütün değerleri alırlar. Nitelik ve sayısal veriler arasındaki ilişki;

8 Dağılımları Tanımlayıcı İstatistikler
Verileri sınıflandırarak özet tabloların oluşturulması, yüzde ve yüzdeliklerin bulunması değişkenlere ilişkin grafiklerin çizilmesi, ortalama ve yaygınlık ölçülerinin elde edilmesi konularını içerir.

9 -Verilerin sınıflandırılması (Frekans Dağılımları)
Tablo 2.1. Yüzücülerin mesafeye göre dağılımı Mesafe Çetele Sayı % Kısa ///// ///// /// ,5 Orta ///// ///// /// ,5 Uzun ///// ///// //// ,0 TOPLAM ,0 Yüzücülerin Cinsiyete Göre Frekans Dağılımını belirleyiniz. TK’97 ye ilişkin frekans dağılımlarını belirleyiniz. Yüzücülerin Cinsiyete Göre Frekans Dağılımını belirleyiniz. TK’97 ye ilişkin frekans dağılımlarını belirleyiniz.

10 Yüzde Kullanmanın Önemi
Yüzdeler herkes tarafından kolayca anlaşılır. Ayrıca iki ya da daha fazla oyuncu ya da takım arasında yapılacak karşılaştırmaların çok çabuk şekilde yapılmasını sağlar. Özellikle gruplar arasına karşılaştırma yaparken ham sayılar üzerinden bildirimde bulunmak yerine yüzdelerle bildirimde bulunmak gerekebilir.

11 Sayısal verilerin Sınıflandırılması
Tablo 2. Yüzücülerin milli Olma Sayılarına Göre Dağılımı Milli Olma Sayısı Sayı % TOPLAM Dağılım aralığı(en büyük ve en küçük değer arasındaki fark) büyüdükçe, değişik değer alan gözlem sayısı çoğunlukla artacağından basit frekans dağılım tabloları kullanışsızdır. Bu durum gözlem sayısının arttığı durumlarda daha da belirginleşir. Bu nedenle veriler sınıflandırılır.

12 Nitelik verilerin aksine sayısal veriler için sınıflandırmak bazı kurallar içerir.
1. Sınıf Sayısı: Oluşturulacak sınıf sayısı 2. Sınıf Sınırı: Oluşturulacak her sınıfın bir alt bir de üst sınır vardır. 3. Sınıf Aralığı; Bir sınıfın alt sınırı ile üst sınırı arasındaki aralıktır. Bu sınırlara sınıf araları denir. 4. Sınıf Değeri; Her sınıfın alt ve üst sınırlarının toplamının yarısıdır. 5. Dağılım aralığı; Dağılımdaki en büyük değerden en küçük değerin çıkarılmasıyla bulunur.

13 Sınıflandırma İşlemleri Sırasında Dikkate Alınacak Kurallar
Sınıflandırma sonucunda, dağılımdaki bütün değerler sınıflara dağıtılabilmeli ve hiçbir değer sınıflama dışında kalmamalıdır. Sınıflama yaparken sınıflar birbirinin içine girmemelidir. Sınıf aralıklarının birbirine eşit olarak düzenlenmesi istatistiksel çözümlemede kolaylıklar sağlar. Ancak gerektiğinde sınıf aralıkları eşit olmayabilir. Dağılım hakkında yeterli bilgiye sahip olabilmek için, oluşturulacak sınıf sayısının 8-15 sınıf arasında (spor bilimlerinde çoğunlukla sınıf arasında) olması önerilmektedir.

14 Örnek Sınıflandırma Tablo 1.1 A daki yüzücü verisini kullanarak bu tabloda MVO2 değerlerinin sınıflandırması şöyledir. Dağılımdaki En Küçük Değer (EKD) ve En Büyük Değer (EBD) bulunur. Dağılım aralığı bulunur. EBD-EKD=? Dağılım aralığı değeri bizim tarafımızdan belirlenen sınıf sayısına bölünerek sınıf aralığı (C) bulunur. Daha sonra her sınıfa düşen frekanslar 1 nolu yüzücüden başlamak üzere önce çetelenir. Sonra sayı olarak her kolonun karşısına yazılırlar. Sonuç aşağıdaki tablo gibi sunulur.

15 Tablo 3. MaxVO2 Dağılımı (ml/kg/dk)
Max VO2 Çetele Sayı % // /// ///// /// ///// ///// /// ///// /// //// // TOPLAM

16 Tablo 4. Üç veri grubuna İlişkin Frekans Dağılımları
Sınıflar Veri Grubu 1 Veri Grubu 2 Veri grubu 3 50-54 3 2 55-59 15 4 60-64 8 7 5 65-69 6 14 70-74 75-79 80-84 1 TOPLAM 40

17 Yığılımlı Frekanslar Herhangi bir sınıfa düşen yüzde yerine ilgili sınıf ile daha alt sınıflara ilişkin yüzde değerlerin toplamı ile ilgilenmek isteyebiliriz. Örneğin Max VO2 değeri 54 ml/kg/dk. ve altında olanların toplam içindeki payı nedir?

18 Max VO2 Frekans % Yığılımlı Frekans Yığ. Yüzde 40-44 2 5.0 5,0 45-49 3 7,5 5 12,5 50-54 8 20.0 13 32,5 55-59 32.5 26 65,0 60-64 34 85,0 65-69 4 10.0 38 95,0 70-74 40 100,0 TOPLAM 100.0

19 YÜZDELİKLER Bir dağılımdaki herhangi bir x değerini dikkate alalım. Bu değer ile bu değerin altında kalan gözlem sayısı içindeki payı bir yığılımlı yüzde değeridir. Bu yığılımlı yüzde değerini hesaplamak için dikkate aldığımız x değerine yüzdelik denir. Yüzde belirli bir miktarı belirtirken yüzdelik, dağılım üzerinde; altında ve üstünde belirli oranda ölçümler bulunan bir noktanın değerini belirtir.

20 Sınıflandırılmamış Verilerde Yüzdelik İşlemleri
15 basketbolcunun 10 ar atış sonrası sonuçları şöyledir ; En iyi 10 sporcuyu seçmek için; 10/15=0,66 seçmesi gerekir 1-0,66=0,33 takıma giremez Buna göre 33. yüzdelik 0,33 x 15 =5. gözlem değeri olan 4 tür. Böylece 4 ve daha az basket atanlar takıma giremezler. Soru; 50. yüzdelik değeri nedir? Soru; 75. yüzdelik nedir?

21 Tablo 6. Yüzücülerin sıralı max VO2 değeri
Gözlem 1 40 11 54 21 58 31 63 2 44 12 22 59 32 64 3 46 13 23 33 4 14 55 24 34 5 49 15 56 25 35 65 6 50 16 26 36 7 52 17 57 27 60 37 66 8 18 28 61 38 67 9 19 29 62 39 72 10 53 20 30 73 Soru: Yüzücülerin % 25 i hangi max Vo2 değerinden daha az değer almıştır Soru: Yüzde kaçının Max VO2 değeri 62 ml/kg/dk dan daha küçüktür.

22 Sınıflandırılmış Verilerde Yüzdelik İşlemleri
Sınıflandırılmış verilerde dağılımdaki herhangi bir yüzdeliği ya da herhangi bir değere (yüzdeliğe) karşılık gelen (yığılımlı yüzdeyi) bulmak amacıyla frekans dağılımı tablosunda sınıf Ara Değeri (SAD) kolonu ile éden daha az sayı ve %” kolonları oluşturulur. Bir sınıfın SAD; bir üstteki sınıfın üst sınırı ile SAD değeri hesaplanacak sınıfın alt sınırının toplamının yarısıdır.

23 Tablo 7. Max vo2 değerinin SAD ve Den daha az frekansları
Frekans Den daha Az Max VO2 (sayı) SAD Sayı % 40-44 2 39,5 0.0 45-49 3 44,5 5.0 50-54 8 49,5 5 12.May 55-59 13 54,5 32.5 60-64 59,5 26 65.0 65-69 4 64,5 34 85.0 70-74 69,5 38 95.0 74,5 40 100.0

24 Sınıflandırılmış Verilerde Yüzdelik Bulma
X= (P x n –Y )x C +L f P: Belirlenen yığılımlı yüzde n: Toplam Gözlem Sayısı Y: Belirlenen yığılımlı yüzdenin içinde bulunduğu aralıkta önceki sınıfın “den daha az frekansı” f: Belirlenen yığılımlı yüzdenin içinde bulunduğu aralıktaki önceki sınıfının frekansı C: Sınıf aralığı L: Belirlenen yığılımlı yüzdenin içinde bulunduğu aralıktan önceki sınıfın sınıf ara değeri Soru: Deneklerin % 25 i hangi Max Vo2 değerinden daha az değer almıştır? (25. yüzdelik nedir?).

25 P: Bulunacak yığılımlı yüzde X: ham skor
Sınıflandırılmış verilerde Bir değere karşılık gelen Yığılımlı yüzdeyi Bulma (X – L)x f + Y C P= _____________ n P: Bulunacak yığılımlı yüzde X: ham skor L Ham skorun içinde bulunduğu iki sınıf ara değerinden öncekinin değeri C Sınıf aralığı f Ham skorun içinde bulunduğu iki sınıf ara değerinden öncekine karşılık gelen sınıfın frekansı Y Ham skorun içinde bulunduğu aralığın önceki sınıfına ilişkin yığılımlı (den daha az frekansı) n Toplam gözlem sayısı Soru : Yüzücülerin yüzde kaçının Max Vo2 değeri 62 ml/kg/dk. Dan daha küçüktür.

26 Grafikler Grafikler elde edilen sonuçların şekillerle ifade edilerek açık ve kolay anlaşılır bir biçimde sunulmasını sağlar. Tüm grafiklerde en az üç özelliğin bulunması gerekir. X ekseninin (yatay eksen)ve y ekseninin (dikey eksen) tanımı. Ayrıca diğer açıklayıcı bilgiler ve notlar da grafik üzerinde yer almalıdır. Bir dağılımı tanımlayan frekanslar ya da yüzdeler genellikle y ekseninde sınıflar ise x ekseninde yer alır. Ancak bu bir zorunluluk değildir. Tersi de olabilir. Grafikte frekansların ya da yüzdelerin kullanılması grafiğin şeklini değiştirmez sadece birimini değiştirir. Nitelik verilerin sunumunda genellikle çubuk grafikten yararlanılırken sürekli ve kesikli sayısal verilerde histogram, dal ve yaprak grafiği ve de kutu ve çizgi grafiklerden yararlanılır.

27 Çubuk grafik Grafik 2. Yüzücülerin mesafelere göre dağılımı

28 Grafik 3. Atletlerin Spor Yılına göre Dağılımı

29 Histogram ve daire dilimleri
Çoğunlukla sürekli değişkenler için kullanılır çubuk grafikten farklı olarak çubuklar birbirine bitişik gösterilir. A branşı için açı: 20/100x360=72

30 Grafik 3. Atletlerin Spor Yılına göre Dağılımı

31 Saçılım Grafiği

32 İKİ YA DA DAHA ÇOK DEĞİŞKEN ARASINDAKİ İLİŞKİLERİN TABLO VE GRAFİKLER YARDIMIYLA İNCELENMESİ
Gözlemlerin, incelenen herhangi bir değişkenin kategorilerine ya da oluşturulan sınıflara göre nasıl dağıldığını gösteren tabloya marjinal tablo adı verilir. Tabloların, “elde edilen bulguların yazı metnine başvurmadan, açık ve kolay anlaşılır biçimde okuyucuya sunulmasını sağlamak” gibi bir amacı vardır. Bir tabloda bulguların sunuluş biçimi yapılacak analizin amacına kullanılacak istatistiksel yönteme ve araştırıcının okuyucuya göstermek veya dikkatini çekek istediği konulara göre değişiklik gösterir. İki ya da daha çok değişkenin birlikte değişiminin incelenmesi çoğu zaman çapraz tablo yapımını gerektirir. İki ya da daha çok değişkenin kategorilerinin kesiştiği yerde frekansların olduğu tablolara çapraz tablo denir. İkili ve üçlü çapraz tablo (iki değişken veya üç değişken inceleniyor ise) Tablo başlığı içeriği anlatmalı satır ve sütün toplamları ile uygun yüzdeler tabloda yer almalıdır.

33 Bağımlı ve Bağımsız Değişkenler
Neden sonuç ilişkisi Spor yaşı ve MaxVO2 – yarışma mesafesi ve maxVO2 Etkilenen, açıklanan ,sonuç, bağımlı değişken ? Etkileyen, açıklayan, neden olan, bağımsız değişken Bağımlı değişken; Bir ya da daha çok etkenin (faktörün) etkisi ile ortaya çıkabilen ve bu etken(ler)le ilişkisi aranan değişken Bağımsız değişken: Bir ya da bağımlı değişkeni etkilediği değişken(ler)dir.

34 Çapraz tablolar çoğunlukla, bağımlı bağımsız değişkenler arasında bir neden sonuç ilişkisi olup olmadığını belirlemek amacıyla oluşturulurken bazen sadece tanımlayıcı bir amaç nedeniyle de oluşturulabilir. Örneğin bir araştırmaya katılan bireylerin yaşa ve cinsiyete göre dağılımını gösteren bir çapraz tablo...

35 DEĞİŞİK TABLO ÖRNEKLERİ VE GRAFİKLER Tablo 3. 1
DEĞİŞİK TABLO ÖRNEKLERİ VE GRAFİKLER Tablo 3.1. Yüzücülerin Cinsiyete ve Yüzme mesafelerine Göre Dağılımı Yüzme Mesafesi Kısa Orta Uzun Cinsiyet Sayı % Toplam Erkek 5 38.5 3 21.4 13 Bayan 8 61.5 11 78.6 27 32.5 14 35.0 40

36 Tablo 3.2 Yarışma mesafesine göre MaxVO2 değerlerinin ortalamaları
Yüzme Mesafesi Max VO2 (ml/kg/dk) X S Min Max n Kısa 52.923 7.251 40 64 13 Orta 58.769 Uzun 60.857 5.573 54 72 14 Toplam 57.600 7.150 73

37 Tablo 3.3 Yarışma Mesafesine Göre max Vo2 Değerlerinin Dağılımı
Max VO2 (ml/kg/dk) 40-49 50-59 60+ Mesafe Sayı % Toplam Kısa 4 30.8 7 53.8 2 15.4 13 Orta 1 7.7 5 38.5 Uzun 0.0 50.0 14 12.5 21 52.5 35.0 40

38 Grafik 3.2. Yüzme Mesafelerine Göre MaxVO2 Değerlerinin Dağılımı (Bu satır Grafiğin Altına bilgi olarak yazılmalıdır)

39 Tablo 4.1. Bir Öğrencinin Ara Sınav Sonuçları
Standartlaştırma Tablo 4.1. Bir Öğrencinin Ara Sınav Sonuçları Ders İngilizce Matematik Psikoloji Puan (xi) 80 65 75

40 Tablo 4.2. Ara sınav İstatistikleri
İngilizce Matematik Psikoloji Xi 80 65 75 X 85 55 60 S 10 5 15

41 Standartlaştırma yardımıyla
1. Birden çok test verildiğinde, bireyin aldığı skorlara göre hangi testte daha başarılı olduğu 2. Birden çok testten alınan puanlara göre hangi bireyin daha başarılı olduğu sorularına yanıt aranır. Verilerin standartlaştırışması ile ilgili olarak değişik yöntemler vardır. Bunlardan z ve T standartlaştırılmasından bahsedilecektir.

42 VERİLERİN STANDARTLAŞTIRILMASI
z SKORU Verilerin standartlaştırılmasında en çok kullanılan yöntemlerden biridir, orijinal verileri ortalaması 0 standart sapması 1 olan yeni bir skora dönüştürmektir. Bu yeni skora, z değerleri ya da standart değerler denir. Bu dönüşüm sonucunda tüm gözlemlerin z değerlerinin ortalaması sıfır ( z = 0) olduğu için verilen puanın hemen altında veya üstünde olduğu söylenebilir. Çünkü ortalamanın üzerindeki değerler pozitif altındaki değerler negatif olacaktır. Ayrıca standart sapma bir olduğu için standart değerin sayısal büyüklüğü; herhangi bir gözlemin ortalamadan kaç standart sapma uzakta olduğunu belirtecektir. , z dönüşümü; xi - x Zi = S

43 Tablo 4.2. Ara sınav İstatistikleri
İngilizce Matematik Psikoloji Xi 80 65 75 X 85 55 60 S 10 5 15 Zi (80-85)10=-0.50 (65-55)/5=+2 (75-60)/15=+1

44 Örneğin; A takımındaki bir sporcunun 30 sn
Örneğin; A takımındaki bir sporcunun 30 sn. içindeki 25 tekrarlık bir şınav skoru dikey sıçramadaki bir 46 cm. lik bir skor kadar iyi bir skor mudur?Ayrıca tekrar sayısı ile cm. nasıl karşılaştırılabilecektir. Her iki değişken için ortalamaların şınav için 20+5 dikey sıçrama için 40+6 cm olduğu düşünülürse 25 kez şınav yapan bir sporcunun (25-20)/5=+1 46 cm. sıçrayan sporcunun z değeri (46-40)/6=+1 olarak bulunur. Bu durumda sporcunun her iki testte de aynı performansı gösterdiği söylenir. Soru: TEST Xi X S 100 m. Kısa mes. Koşu(sn) 15 atışta basket sayısı(sayı) Yazılı sınav (100 üzerinden puan)

45 Normal Dağılım:Max VO2 ölçümlerinin dağılımı (tablo 2
Normal Dağılım:Max VO2 ölçümlerinin dağılımı (tablo 2.7) yada histogramı (grafik 2.2), incelendiğinde ölçümlerin büyük bir bölümünün ortalama etrafında yoğunlaştığı ve ortalamadan uzaklaştıkça frekans sayılarının azaldığı görülür. Sürekli sayısal veri tipinde olan(ölçümle belirtilen) değişkenlerin çoğu (özellikle denek sayısı arttıkça (>30)) bu tür bir dağılım gösterme eğilimindedir. Şekil olarak çana benzeyen ve simetrik yapıya sahip olan bu tür dağılımlara normaL dağılım denir. Normal dağılım tek tepeli bir dağılım olup, dağılımın ortalaması, ortancası ve tepe değeri birbirine eşittir.

46 Normal dağılıma uygunluğun araştırılması
Sayısal verilerde dağılımların yapısını görmek amacıyla histogramlara ya da benzeri grafiklere baş vurulduğunda grafiğin çan eğrisine benzemesi normalliği garanti etmemektedir. Bir dağılımın normal olup olmadığını test etmek amacıyla bir takım yöntemler geliştirilmiştir. Bunlardan bir bölümü grafik (Q-Q, P-P, Detrended) bir bölümü test (aralık yöntemi) yöntemidir. İstatistik yazılımlar için de Shapiro Wilks ve Kolgomorov-Smirnow (K-S)

47 Aralık Yöntemi Gözlem (denek) sayısının az olduğu durumlarda çan eğrisi şeklinde simetrik (ya da simetriğe yakın) bir grafik yapısına sahip dağılımlar için kolay bir yöntemdir. Eğer bir dağılımda 1. X+1x (s. Sapma) sınırları deneklerin %68.26 sı 2. X+2x(S. Sapma) sınırları arasında deneklerin %95.44 ü 3. X+3x(S. Sapma) sınırları arasında deneklerin %99.74 ü bulunuyorsa dağılımın normal dağılıma uyduğu söylenir. Bu yöntemin bir sakıncası bir dağılımın normal dağılıp dağılmadığını anlamak için dağılımdan elde edilen yüzdelerin %68.26, %95.44, % 99.74’e ne kadar yakın olması gerekir.

48 HİPOTEZ TESTLERİ İstatistiksel çıkarımsama örneklem istatistikleri yardımıyla evren parametreleri hakkında kestirimde bulunma sürecidir. Hipotez testlerinin amacı; araştırıcıya, yöneticiye spor bilimciye,.. vb. evrenden çekilen örneklemler yardımıyla evren hakkında bir karara varma konusunda yardımcı olmak şeklinde özetlenebilir. Tablo 1.1.A daki MaxVO2 miktarının yüzme mesafesine göre değişimi istatistiksel olarak anlamlı mıdır? Sutopu ve basketbol yıldız milli takımı evrenine ilişkin vücut yağ yüzde ortalamaları arasında istatistiksel açıdan fark olup olmadığı bir hipotez testi ile araştırılabilir. Atletlere ilişkin evrende atletlerin 98 yılı teknik kapasiteleri 97 yılına göre istatistiksel açıdan farklılık göstermiş midir? Doğu Anadolu ve ege bölgesinde yaşayan15 25 arası bireylerin yüzde kaçının spor yaptığı v e bu yüzdeler arasında fark olup olmadığı uygun bir hipotez testi yardımıyla test edilebilir.

49 Bu örneklerden de anlaşılabileceği gibi hipotez testleri araştırma planına, veri tipine, denek sayısına, verilerin normal dağılım gösterip göstermediğine... göre değişik özellikler gösterir. Değişik amaçlar için geliştirilmiş değişik hipotez testleri vardır. Bu testler arasından uygun olanının seçilmesi ve elde edilen sonuçların doğru olarak yorumlanması gerekir.

50 HİPOTEZ TESTLERİNİN AŞAMALARI
1. Hipotezlerin belirlenmesi İstatistiksel hipotezler. Örneklemlerin çekildiği evren parametreleri ilgili önermelerdir. İstatistikte kullanılan iki türlü hipotez vardır. Ho hipotezi: Sıfır hipotezi ya da farksızlık hipotezi Bir testte öne sürülen ve test edilmek istenen hipotezdir. H1 hipotezi: Alternatif hipotez veya seçenek hipotezidir ve Ho hipotezine karşı kurulan hipotezdir. Ho: Erkek ve bayan yüzücülerin spor bilgi puanları ortalamaları arasında fark yoktur. Alternatif hipotezler şöyle olacaktır. H1: a) Erkek ve bayan yüzücülerin spor bilgi puanı ortalamaları arasında fark vardır Çift yönlüdür çünkü spor bilgi puanları arasında fark olması önemli olup bir ortalamanın diğerinden büyük ya da küçük olması önem taşımamaktadır.

51 b) Erkek yüzücülerin spor bilgi puanı ortalaması bayan yüzücülerin spor bilgi puanı ortalamasından büyüktür Tek yönlü bir hipotezdir çünkü erkeklerin bilgi puanının daha büyük olduğu iddia edilmektedir. C) Erkek yüzücülerin spor bilgi puanı ortalaması bayan yüzücülerin spor bilgi puanı ortalamasından küçüktür Tek yönlü bir hipotezdir 2. Hipotezler için uygun test istatistiğine karar verilmesi Değişik hipotez testleri için değişik test istatistiklerinden yararlanılır. Yukarıdaki örnekte olduğu gibi iki grubun ortalamasının karşılaştırılası için kullanılacak hipotez testi üç grubun karşılaştırılması için gerekli olan testten farklı olacaktır. İstatistiksel test için anlamlılık düzeyinin belirlenmesi Anlamlılık ya da yanılma ya da hata düzeyi çoğunlukla istatistiksel test uygulamadan önce araştırıcı tarafından belirlenir ve α (alfa) olarak tanımlanır α ;Ho hipotezi doğru iken onu yanlışlıkla reddetme olasılığını verir. Yanılma düzey olarak α =0.05, α=0.01, α= gibi küçük değerler alınır. Yanılma düzeyi için istatistiksel yazılımlarda kullanılan bir başka kavram P veya p değeridir.

52 4. İstatistiksel karar Bilgisayar programlarında p değeri daha önce seçtiğimiz yanılma düzeyinden küçük ise Ho reddedilir. Örneğin α=0.05 olarak belirlendiğinde test istatistiğine ilişkin p değeri bulunmuş ise H0 hipotezi reddedilir. H1 hipotezi tek yönlü kurulmuşsa tek yönlü bir tablo değerinden yararlanmak çift yönlü kurulmuşsa çift yönlü hazırlanmış bir tablodan yararlanmak gereklidir. TEST ÇEŞİTLERİ PARAMETRİK VE PARAMETRİK OLMAYA(NON PARAMETRİK) HİPOTEZ TESTLERİ İstatistiksel yöntemlerin bir bölümü örneklemlerin çekildiği evren dağılımının bilindiği varsayımına dayalıdır. Evren dağılımının bilindiği varsayımın adayalı hipotez testlerine parametrik hipotez testleri denir. Evren dağılımları konusunda herhangi bir bilginin ya da varsayımın bulunmadığı testlere non-parametrik testler denir. Parametrik hipotez testlerinde örneklem (lerin) çekildiği evrenlerin normal dağılım göstermesi ve varyansların homojen olması temel iki varsayım ike parametrik olmayan hipotez testlerinde evren dağılımları konusunda herhangi bir varsayım yoktur. i

53 Parametrik testlerde, örneklemdeki denek sayılarının 30 ya da 30 un üzerinde olması istenirken non-parametrik testlerde denek sayılarının az olduğu durumlarda kullanılır. Denek sayısının 30 veya daha fazla olmasının sebebi böyle durumlarda örneklem istatistiklerinin evren parametrelerine yaklaşım göstermesi böylelikle evren dağılımının özellikleri hakkında bilgi sahibi olunmasıdır. Parametrik testlerde, veri tipinin sürekli sayısal veri olması sözkonusu iken parametrik olmayan testlerde veri tipi nitelik ya da sayısal (sürekli-kesikli) olabilir. Gerek parametrik gerekse parametrik olmayan testlerde gruplardaki denek sayılarının birbirine eşit ya da yakın olması testlerin güvenirliğini arttırır. Hem parametrik hem non-parametrik olamayan testlerde örneklem ya da örneklemler evrenden rastgele seçilmelidir.

54 Bazı parametrik testler ve parametrik olmayan karşılıkları
İki ortalama arasındaki farkın Anlamlılık testi Tek yönlü varyans analizi testi İki eş arasındaki farkın anlamlılı testi Tekrarlı ölçümlerde tek yönlü varyans analizi İki yüzde arasındaki farkın Anlamlılık testi Bağımlı Örneklerde İki yüzde arasındaki farkın Anlamlılık Testi (z testi) Parametrik olmayan Mann Whitney U testi Kruskal-Wallis varyans Analizi testi Wilcoxon Eşleştirilmiş İki Örnek testi Friedman iki yönlü Varyans Analizi 4 Gözlü Ki-kare testi Bağımlı Örneklerde Ki-kare testi (McNemar testi)

55 Parametrik olmayan testlerde Dikkat Edilecek Noktalar
1. Karşılaştırılacak Grupların Oluşturulması Hipotez testi için deney düzenlenirken birey ya da gözlemlerin birbirine benzer özelliklere sahip olmasına özellikle dikkat edilmelidir. Örneğin amaç erkek ve bayan atletlerin MaxVO2 düzeyleri arasında fark olup olmadığını araştırmak ise erkek ve bayan atletlerin benzer yaşlarda benzer spor yaşlarında ve benzer mesafelerde koşan atletler olmaları istenir.Çünkü MaxVo2 değerleri de bu bağımsız değişkenlerden etkilenir. 2. Karşılaştırılacak grupların bağımlı ya da bağımsız olması Seçilecek parametrik ya da parametrik olmayan hipotez testi grupların bağımlı ya da bağımsız olmasına göre değişiklik gösterir. Bir gözlem (denek) üzerinde birden çok ölçüm yapıldığında gruplar bağımlı olur. Örneğin tablo MK 97 ve Mk 98 Birbirine bağımlıdır. İncelenen değişken yönünden aynı sporcular aynı sporcular iki farklı zamanda ölçülmüşlerdir. Bir grupta buluna bir birey (gözlem) diğer grup ya da gruplarda yer almıyorsa karşılaştırılacak gruplar bağımsızdır. Örneğin tablo 1.1.A erkek ve bayan yüzücülerin MK97 bu gruplar birbirinden bağımsızdır. Çünkü bir grupta yer alan bir yüzücü diğer grupta yer almaz.

56 VARYANSLARIN HOMOJENLİK TESTİ
Parametrik standar varsayımlarından biri karşılaştırılacak gruplarının varyanslarının homojen (benzer) olmasıdır. Genel olarak bir grubun varyansı diğer grubun varyansından fazla ise varyansların heterojen olduğu önkanısına varılabilir. İstatistik yazılımlarda kullanılabilen test LEVENE testidir.

57 İki Ortalama Arasındaki farkın Anlamlılık Testi
İncelenen değişken yönünden birbirinden bağımsız iki grubun ortalamaları karşılaştırılır. A) karşılaştırılacak iki grup vardır B) gruplar birbirinden bağımsızdır C)Veriler sürekli sayısal veri grubundadır D)Gruplardaki denek sayıları 30 a yakın ve ye 30 dan büyüktür E)Evren dağılımları normal dağılım gösterir F)Evren varyansları homojendir. Örnek: Tablo 1.1 de yüzücülerle atletlerin MaxVO2 ölçümleri arasında fark olup olmadığının araştırması gibi.. İki ortalama arasındaki farkın anlamlılık testindeki varsayımların bir ya da daha fazlasının sağlanamadığı durumlarda bu testin parametrik olmayan karşılığı Mann-Whitney U testi kullanılır. Ancak budurumda kurulacak Ho hipotezi İki ortalama arasında fark yoktur şeklinde değil iki dağılım arasında fark yoktur şeklindedir. İstattistik programlarında bu test Wilcoxon rank sum test veya Mann-whitney-wilcoxon rank sum test olarak anılır.

58 BAĞIMSIZ İKİDEN ÇOK GRUBUN KARŞILAŞTIRILMASI
Tek Yönlü varyans analizi: Parametrik test varsayımları tamamlandığında ölçümle belirtilen bir değişken yönünden ikiden fazla grup arasında fark olup olmadığını test etmek için kullanılır. Varyans analizi iki ortalama arasındaki farkın anlamlılık testinin 2 den çok grup için genellenmiş durumudur. İki ortalama arasındaki farkın anlamlılık testi için gerekli varsayımlar bu test içinde geçerlidir. Varyans analizine ilişkin varsayımlardan bir ya da daha fazlasının sağlanmadığı durumlarda bu testin parametrik olmayan karşılığı Kruskall-Wallis varyans analizi kullanılır. Örnek Tablo 1.2 de verilen her bir değişken için su topu, basketbol ve voleybol milli takımlarının arasında fark olup olmadığı veya Hiç spor yapmamış ilköğretim okulu 5. Sınıf öğrencilerini rastgele 4 gruba ayırarak 1. Gruba A 2. Gruba B, 3. Gruba C türü esneklik antrenmanı uygulayalım 4. Grubu ise kontrol grubu olarak bırakalım. 2 ay sonra 4 grubun esnekliklerişni ölçerek 4 gruptakii öğrencilerin esneklik ölçümleri arasında fark olup olmadığını, fark varsa hangi esneklik yönteminin daha etkili olduğunu incelemek istediğimizde...

59 Varyans analizi sonucu anlamlı olduğunda farklı grupların belirlenmesi: Varyans analizi sonucunda gruplar arasında fark yoksa işlemler sona erer. Ancak gruplar arsasında fark varsa farklılığın hangi grup ya da gruplardan kaynaklandığı (ya da farklılığın hangi gruplar arasında olduğu) değişik yöntemlerle araştırılabilir.Bu yöntemlere Post-Hoc testleri denir. Bu yöntemler arasında en çok kullanılanları en küçük önemli fark yöntemi, Duncan Yöntemi, Tukey HSD yöntemi, Dunnet yöntemi, Student-Newman-Keuls Yöntemi..

60 BAĞIMLI İKİ GRUBUN KARŞILAŞTIRILMASI.
İki eş arasındaki Farkın anlamlılık testi: Bağımlı grup sayısı 2, veriler ölçümle belirtilmiş, denek sayısı 30 civarında ve daha fazla ve de gruplar daki gözlem değerlerini birbirinden çıkartarak elde edilen fark değerlerinin dağılımı normal dağılım gösteriyorsa; gruplar arasında fark olup olmadığı (bağımlı iki grup arasında fark olup olmadığı) bu testle incelenir.Bu testin parametrik olmayan karşılığı Wilcoxon Eşleştirilmiş iki Örnek testi (parametrik test varsayımları tutumuyor ve veri kesikli sayısal veri ise ...)dir. Örnek: Tablo 1.1.de, Atletlerin 1997 ve 1998 yıllarındaki maksimum kaldırma kuvvetleri arasındaki fark olup olmadığı test edilmek istenebilir. Aynı bireylerin kaldırma kuvveti yönünden değişik iki zaman dilimindeki ölçümleri arasında bir fark olup olmadığı araştırılmak istenmektedir.Karşılaştırılacak grup sayısı 2, grupla birbirine bağımlı, veri ölçümle belirtilmiş, n>30,1997 yılı maksimum kald. Kuvv.değerleri 1998 değerlerinden çıkarıldığında elde edilen fark normal dağılım gösterir.

61 Bağımlı İkiden Çok Grubun Karşılaştırılması
Tekrarlı Ölçümlerde Tek Yönlü Varyans Analizi: İki eş arasındaki farkın anlamlılık testinin ikiden çok grup için kullanılmış şeklidir. Bu testin uygulanamadığı durumlarda Friedman İki Yönlü Varyans Analizinden yararlanılır. Örneğin hentbol oyuncularının çalışma başlangıcı, kamp dönemi öncesi, kamp dönemi sonrası ve turnuva öncesi performanslarının ölçümlerinin zaman içinde değişip değişmediğini değişme varsa anlamlı olup olmadığını bu testle bulabiliriz.

62 BAĞIMSIZ GRUPLARIN KARŞILAŞTIRILMASI
Bağımsız gruplarda İki yüzde arasındaki farkın Anlamlılık testi: Bağımlı değişkenin “iki durumlu nitelik veri” tipinde olduğu durumlarda (teknik kapasite; yeterli-yetersiz , sağlık durumu; sakat sakat değil, sigara içme durumu.. vb)bağımsız iki gruptan elde edilen ve iki kategoriden birine ait olan yüzdeler arsındaki farkın istatistiksel açıdan farklı olup olmadığının test edilmesinde kullanılır.Bu yöntem , ölçümle ya da sayımla belirtilmesine rağmen sonradan nitelik durumuna getirilen verilerin incelenmesinde de kullanılır. Örnek: Tablo 1.1.B. Atletlerin milli olma sayıları ile teknik kapasiteleri arasında ilişki olup olmadığı...Bu amaçla bağımsız değişken olan milli olma sayılarını 0-5 kez ve 6+ kez şeklinde iki gruba ayırmak gerekmektedir. Verilerde 0-5 kez milli olan kez milli olan 14 atlet vardır. Bu gruplardaki atletler arasında teknik kapasitesi “yeterli” olanların sayı ve yüzdesi tablo da verilmiştir.Bağılmlı değişken teknik kapasite olup yeterli yetersiz şeklinde iki kategorilidir. Karşılaştırılan grup sayısı ikidir. 0-5 kez milli olan atletlerin yeterli teknik

63 kapasiteye sahip olma yüzdesinin 6+ kez milli olan atletlerden farklı olup olmadığı araştırılmaktadır. Karşılaştırılan gruplar bağımsızdır. Bu durumda hesaplamalar için gerekli tablo aşağıdaki gibi olacaktır. Tablo 7.25 Milli olma Sayılarına Göre TK değerlerinin Sayı ve Yüzdesi (a) (b) (b/ax100) Milli Olma Toplam Göz. Teknik Kap. Teknik Kap. Sayısı Sayısı “Yeterli” Ol sa. “Yeterli” Ol Yüzde Toplam Ki-kare Testleri Genel anlamda bu testler veri tipinin “nitelik”olduğu durumlarda kullanılır. Örneğin Bir bölgede spor yapıp yapmama cinsiyete göre değişiklik göstermekte midir?Bu örnekte her iki değişken de iki kategorili nitelik değişken tipindedir. (erkek-bayan, spor yapıp yapmama)

64 Ki kare testleri genel olarak; iki ya da daha çok grup arasında incelenen nitelik özellik yönünden fark olup olmadığı ve/ya da iki nitelik değişken arasında bir bağ bulunup bulunmadığının araştırılmasında kullanılır. Bağımsız gruplarda 2x2 Ki-Kare testi Fisher Kesin Ki-kare testi Çok gözlü düzenlerde ki-kare testi BAĞIMLI GRUPLARIN KARŞILAŞTIRILMASI Bağımlı gruplarda iki yüzde arasındaki farkın Anlamlılık testi Niteliksel bir değişken yönünden aynı bireylerden iki değişik zaman ya da iki değişik durumda elde edilen iki yüzde arasında fark olup olmadığının araştırılmasında kullanılır. Örnek Tablo 1.1.B de atletlerin yılı teknik kapasiteleri arasında farkj olup olmadığı... Gözlem sayısının az olduğu durumlarda Bağımlı gruplarda ki kare testi Cochran Q testi kullanılır...


"Yrd. Doç. Dr. İpek EROĞLU KOLAYİŞ" indir ppt

Benzer bir sunumlar


Google Reklamları