Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

İstatistikte Bazı Temel Kavramlar

Benzer bir sunumlar


... konulu sunumlar: "İstatistikte Bazı Temel Kavramlar"— Sunum transkripti:

1 İstatistikte Bazı Temel Kavramlar
Kaynaklar Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme İstatistik Yöntemler ve Uygulaması, H.Arıcı Evren Gözlem alanına giren obje ya da bireylerin tümü Örneklem Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup

2 Değişken Değişkenler nicel ya da nitel olabilir. Nitel veriler
Her gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara denir Değişkenler nicel ya da nitel olabilir. Nitel veriler Sayısal veriler -kesikli sayısal veriler (maç kazanma sayısı) -sürekli sayısal veriler (boy, kilo) Nitelik ve sayısal veriler arasındaki ilişki (boy sınıflandırması)

3 Ölçme objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir. Değişkenler hakkında bilgi edinmek için yapılır Ölçüm Ölçme sonucunda elde edilen değer

4 Anlamlı rakam X=2.8 1 2 3 4 5 6 X=5.0 5 cm = 5,0cm

5 İstatistikte Bazı Temel kavramlar
Sayıları yuvarlama 5, = 5,39 = 5,4 = 5 İstatistikte Bazı Temel kavramlar Aritmetik Ortalama Aralık (range) Sapma Standart sapma Ölçümlerin dağılımı ve standart sapma ile ilişkisi

6 Değişken Range Aritmetik ortalama d2 d1 Sapma
X= değerlerin toplamı/değer sayısı Aritmetik ortalama d2 d1 Sapma

7 Standart sapma:  Bir dizi ölçümün gösterdiği değişimin en güvenilir ölçüsüdür. Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür. Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır

8 Standart sapma:  Standart sapma /bütün elemanların ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir. [ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi) ve yukarıdaki ifadenin karekökü ortalama değer

9 Ortanca (medyan) 50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2 Çift ise n/2 nci ile n+2/2 nci değeri /2 dir. Veriler büyükten küçüğe doğru sıralanır ortadaki iki değerin aritmetik ortalaması alınır 5,5,6,6,7,9,9, /2 5,5,6,6,7,9,9, /2=4, 8+2/4=5 6+7=13/2=6,5

10 Tepe değer (mod) Dağılımda en fazla tekrarlanan değerdir.
Frekansı en fazla olan sınıfın değeridir. 5,5,6,6,6,7,9,9,10

11 Ölçme Sonucunun Gösterilmesi
X = 5,8 ± 0,25 Yanlış Gösterim X = 58 ± 0,2 X = ± 2 X = ± 0.2 Doğru Gösterim

12 İstatistiksel Verileri Tasnif Etme

13 İstatistiksel Verileri Tasnif Etme
İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu: Sözel ifadelerle açıklama Tablolar halinde düzenleme Grafikle gösterme Verileri değerlendirerek istatistiksel ölçüler bulma Bu yöntemlerde birkaçını birlikte uygulama

14 12 10 Frekans 8 6 4 2 Puan Verilerin grafikle gösterilmesi
Çizgi grafiği Çubuk grafik (Histogram) Pasta grafiği 12 10 Frekans 8 6 4 2 30 40 40 50 60 70 80 90 Puan

15 8 7 Frekans 6 5 4 3 30 40 40 50 60 70 80 90 Puan

16 Yıllar

17 İstatistiksel Verileri Tasnif Etme
Pasta grafiği Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır

18

19 Doğru Grafik Seçme AB Ülkelerinde Genel Lise Meslek Lisesi Oranları
İkisi de olabilir. Birincisi daha uygun

20 Ülkelere Göre Eğitim Yaşı
Doğru Grafik Seçme Ülkelere Göre Eğitim Yaşı Doğru Yanlış

21 Doğru Grafik Seçme Yıllara göre okul yaşı Doğru Yanlış

22 NORMAL DAĞILIM NEDIR İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.

23 Frekans eğrisi çan şeklinde olan simetrik dağılımdır.
Normal dağılım, Standart sapması Frekans eğrisi çan şeklinde olan simetrik dağılımdır. Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir

24

25 Dağılım şekli ölçütleri :  Çarpıklık –1 ve +1 arasında yer alır.
Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık, Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.

26 Dağılım özelliğinin önemi nedir
Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir

27 NORMAL DAĞILIMIN KRİTERLERİ
Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri < ise dağılımın normal olmadığı sonucuna varılır.

28 Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :
1.      Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak. 2.      Varolan verilere parametrik olmayan bir test uygulamak

29 KESTİRİM Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır. Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.

30 Hipotez testleri : Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve Ho ile gösterilir. H1 ile gösterilen alternatif hipotez  adı verilen hipotez ise, Ho hipotezinin tam tersidir.

31 P değeri ve yanılma düzeyi :
Ho hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani Ho hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır

32 Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır. Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır

33 Testler Parametrik Parametrik olmayan
İki ortalama arasındaki farkın anlamlılık testi t. test Mann-Witney U testi Tek yönlü varyans analizi (f testi) Kruskal-Wallis varyans analizi İki eş arasındaki farkın anlamlılık testi (t test) Wilcoxon eşleştirilmiş iki örnek testi Tekrarlı ölçümlerde varyans analizi (f testi) 4 gözlü Ki-Kare testi Bağımlı örneklerde iki yüzde rasındaki farkın anlamlılk testi ( z testi) Bağımlı örneklerde ki-kare testi (McNemer testi)

34 Bağımlı gurup- bağımsız gurup kavramı
Bağımlı gurup: bir gözlem (denek) üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.

35 TESTLER

36 BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI
İki ortalama arasındaki farkın anlamlılık testi T. Testi Gerekli koşullar 1.Karşılaştırılacak iki gurup vardır 2. Guruplar birbirinden bağımsızdır 3. Veriler sürekli veri gurubundadır 4: evren dağılımları normal dağılım gösterir 5. Evren varyansları eşitti.

37 Mann-Witney U testi İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır. Parametrik koşulları sağlanmadığı durumda kullanılır

38 Bağımsız ikiden çok gurubun karşılaştırılması
Tek yönlü varyans analizi İkiden çok bağımsız gurup olduğunda ve parametrik koşullar sağlandığında uygulanır. Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.

39 Varyans analizinde farkın kaynaklandığı gurubu belirleme
Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan kaynaklandığını belirlemede 1. duncan yöntemi Tukey HSD yöntemi Dunnet yöntemi Student nevman-Keuls Yöntemi kullanılır

40 Korelasyon Korelasyon: iki değişken arasında bağıntı olup olmadığını araştırma Korelasyon katsayısı – r - Regrasyon analizi: bağıntının türünü bulma

41 Korelasyon Fizik Notları Matematik Notları

42 Korelasyon kararı için bir-kaç veri yeter mi?
Ortalama ömür Ülke nüfusu

43 Korelasyon var mı? Matematik Notları Resim Notları

44 Korelasyon var mı? Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok. Frekans r* 5 0,878 10 0,632 15 0,514 20 0,444 30 0,361 40 0,312

45 Grafik Analizi

46 Grafik Analizi Basit korelasyon işlemlerinde kullanılır.
Grafik çizimi işlem sırası: Eksenlerin belirlenmesi Uygun ölçek seçimi Verilerin yerleştirilmesi Lineer grafik elde edilmesi Eğim bulunması

47 Eksenlerin belirlenmesi Bağlı değişken(birim) Serbest değişken (birim)

48 Her iki ölçek uygun değil
Ölçek Seçimi Kütle Hacim Her iki ölçek uygun değil

49 Ölçek Seçimi Y ölçeği uygun değil
Kütle Hacim Y ölçeği uygun değil

50 Ölçek Seçimi X ölçeği uygun değil
Hacim Kütle X ölçeği uygun değil

51 Ölçek Seçimi Uygun ölçek seçimi
Kütle Hacim Uygun ölçek seçimi

52 Doğru çizimi Yanlış çizim Doğru çizim Kütle Hacim

53 Doğru çizimi Hacim Kütle Yanlış çizim Doğru çizim

54 Eğim Bulunması Zaman Hız Dikkat! Eğim= Hız/zaman = Tan!


"İstatistikte Bazı Temel Kavramlar" indir ppt

Benzer bir sunumlar


Google Reklamları