Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

İstatistikte Bazı Temel Kavramlar Evren Evren –Gözlem alanına giren obje ya da bireylerin tümü Örneklem Örneklem –Bir evrenden seçilmiş daha küçük sayıdaki.

Benzer bir sunumlar


... konulu sunumlar: "İstatistikte Bazı Temel Kavramlar Evren Evren –Gözlem alanına giren obje ya da bireylerin tümü Örneklem Örneklem –Bir evrenden seçilmiş daha küçük sayıdaki."— Sunum transkripti:

1 İstatistikte Bazı Temel Kavramlar Evren Evren –Gözlem alanına giren obje ya da bireylerin tümü Örneklem Örneklem –Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup Kaynaklar Fiziksel Ölçmeler ve Değerlendirmesi, İ.EşmeFiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme İstatistik Yöntemler ve Uygulaması, H.Arıcıİstatistik Yöntemler ve Uygulaması, H.Arıcı

2 Değişken Değişken Her gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara denirHer gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara denir Değişkenler nicel ya da nitel olabilir. Değişkenler nicel ya da nitel olabilir. Nitel verilerNitel veriler Sayısal verilerSayısal veriler -kesikli sayısal veriler (maç kazanma sayısı) -sürekli sayısal veriler (boy, kilo) Nitelik ve sayısal veriler arasındaki ilişki (boy sınıflandırması)Nitelik ve sayısal veriler arasındaki ilişki (boy sınıflandırması)

3 Ölçme Ölçme –objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir. –Değişkenler hakkında bilgi edinmek için yapılır ÖlçümÖlçüm –Ölçme sonucunda elde edilen değer

4 X= X=5.0 5 cm = 5,0cm Anlamlı rakam Anlamlı rakam

5 Sayıları yuvarlamaSayıları yuvarlama 5, = 5,39 = 5,4 = 5 İstatistikte Bazı Temel kavramlar Aritmetik OrtalamaAritmetik Ortalama Aralık (range)Aralık (range) SapmaSapma Standart sapmaStandart sapma Ölçümlerin dağılımı ve standart sapma ile ilişkisiÖlçümlerin dağılımı ve standart sapma ile ilişkisi

6 Range Değişken d1d1 Aritmetik ortalama Sapma d2d2 X= değerlerin toplamı/değer sayısı

7 Standart sapma:  Bir dizi ölçümün gösterdiği değişimin en güvenilir ölçüsüdür.Bir dizi ölçümün gösterdiği değişimin en güvenilir ölçüsüdür. Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür.Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür. Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır

8 Standart sapma:  Standart sapma / bütün elemanların ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir. [ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi) ve yukarıdaki ifadenin karekökü.. ortalama değer

9 Ortanca (medyan) 50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2 50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2 Çift ise n/2 nci ile n+2/2 nci değeri /2 dir. Çift ise n/2 nci ile n+2/2 nci değeri /2 dir. Veriler büyükten küçüğe doğru sıralanır ortadaki iki değerin aritmetik ortalaması alınır Veriler büyükten küçüğe doğru sıralanır ortadaki iki değerin aritmetik ortalaması alınır 5,5,6,6,7,9,9, 7+1/2 5,5,6,6,7,9,9, 7+1/2 5,5,6,6,7,9,9,10 8/2=4, 8+2/4=5 5,5,6,6,7,9,9,10 8/2=4, 8+2/4=5 6+7=13/2=6,5 6+7=13/2=6,5

10 Tepe değer (mod) Dağılımda en fazla tekrarlanan değerdir. Dağılımda en fazla tekrarlanan değerdir. Frekansı en fazla olan sınıfın değeridir. Frekansı en fazla olan sınıfın değeridir. 5,5,6,6,6,7,9,9,10 5,5,6,6,6,7,9,9,10

11 Ölçme Sonucunun Gösterilmesi X = 5,8 ± 0,25 X = 58 ± 0,2 X = 58.3 ± 2 Yanlış Gösterim X = 58.3 ± 0.2Doğru Gösterim

12 İstatistiksel Verileri Tasnif Etme

13 İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu:İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu: 1.Sözel ifadelerle açıklama 2.Tablolar halinde düzenleme 3.Grafikle gösterme 4.Verileri değerlendirerek istatistiksel ölçüler bulma 5.Bu yöntemlerde birkaçını birlikte uygulama İstatistiksel Verileri Tasnif Etme

14 Verilerin grafikle gösterilmesi –Çizgi grafiği –Çubuk grafik (Histogram) –Pasta grafiği Frekans Puan

15 Frekans Puan

16 Yıllar

17 Pasta grafiği İstatistiksel Verileri Tasnif Etme Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır

18

19 Doğru Grafik Seçme AB Ülkelerinde Genel Lise Meslek Lisesi Oranları İkisi de olabilir. Birincisi daha uygun

20 Doğru Grafik Seçme Ülkelere Göre Eğitim Yaşı DoğruYanlış

21 Doğru Grafik Seçme Yıllara göre okul yaşı DoğruYanlış

22 NORMAL DAĞILIM NEDIR – İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. – Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. – Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.

23 Standart sapması Standart sapması Frekans eğrisi çan şeklinde olan simetrik dağılımdır. Frekans eğrisi çan şeklinde olan simetrik dağılımdır. Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir Normal dağılım,

24

25 Dağılım şekli ölçütleri : Çarpıklık –1 ve +1 arasında yer alır. Dağılım şekli ölçütleri : Çarpıklık –1 ve +1 arasında yer alır. Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık, Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık, Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir. Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.

26 Dağılım özelliğinin önemi nedir Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir

27 NORMAL DAĞILIMIN KRİTERLERİ Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n 30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri 30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır.

28 Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir : 1. Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak. 2. Varolan verilere parametrik olmayan bir test uygulamak

29 KESTİRİM Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır. Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır. Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır. Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.

30 Hipotez testleri : Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve H o ile gösterilir. Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve H o ile gösterilir. H 1 ile gösterilen alternatif hipotez adı verilen hipotez ise, H o hipotezinin tam tersidir. H 1 ile gösterilen alternatif hipotez adı verilen hipotez ise, H o hipotezinin tam tersidir.

31 P değeri ve yanılma düzeyi : H o hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani H o hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır H o hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani H o hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır

32 Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır. Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır. Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır

33 Testler ParametrikParametrik olmayan İki ortalama arasındaki farkın anlamlılık testi t. test Mann-Witney U testi Tek yönlü varyans analizi (f testi)Kruskal-Wallis varyans analizi İki eş arasındaki farkın anlamlılık testi (t test) Wilcoxon eşleştirilmiş iki örnek testi Tekrarlı ölçümlerde varyans analizi (f testi) 4 gözlü Ki-Kare testi Bağımlı örneklerde iki yüzde rasındaki farkın anlamlılk testi ( z testi) Bağımlı örneklerde ki-kare testi (McNemer testi)

34 Bağımlı gurup- bağımsız gurup kavramı Bağımlı gurup: bir gözlem (denek) üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur Bağımlı gurup: bir gözlem (denek) üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur. Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.

35 TESTLER

36 BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI İki ortalama arasındaki farkın anlamlılık testi İki ortalama arasındaki farkın anlamlılık testi T. Testi T. Testi Gerekli koşullar Gerekli koşullar 1.Karşılaştırılacak iki gurup vardır 2. Guruplar birbirinden bağımsızdır 3. Veriler sürekli veri gurubundadır 4: evren dağılımları normal dağılım gösterir 5. Evren varyansları eşitti.

37 Mann-Witney U testi İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır. İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır. Parametrik koşulları sağlanmadığı durumda kullanılır Parametrik koşulları sağlanmadığı durumda kullanılır

38 Bağımsız ikiden çok gurubun karşılaştırılması Tek yönlü varyans analizi Tek yönlü varyans analizi İkiden çok bağımsız gurup olduğunda ve parametrik koşullar sağlandığında uygulanır. İkiden çok bağımsız gurup olduğunda ve parametrik koşullar sağlandığında uygulanır. Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir. Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.

39 Varyans analizinde farkın kaynaklandığı gurubu belirleme Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan kaynaklandığını belirlemede Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan kaynaklandığını belirlemede 1. duncan yöntemi 1. duncan yöntemi Tukey HSD yöntemi Tukey HSD yöntemi Dunnet yöntemi Dunnet yöntemi Student nevman-Keuls Yöntemi kullanılır Student nevman-Keuls Yöntemi kullanılır

40 Korelasyon: iki değişken arasında bağıntı olup olmadığını araştırmaKorelasyon: iki değişken arasında bağıntı olup olmadığını araştırma Korelasyon katsayısı – r -Korelasyon katsayısı – r - Regrasyon analizi: bağıntının türünü bulmaRegrasyon analizi: bağıntının türünü bulma Korelasyon

41 Matematik Notları Fizik Notları

42 Korelasyon kararı için bir-kaç veri yeter mi? Ülke nüfusu Ortalama ömür

43 Korelasyon var mı? Matematik Notları Resim Notları

44 Korelasyon var mı? Frekansr* 50, , , , , ,312 Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok.

45 Grafik Analizi

46 Basit korelasyon işlemlerinde kullanılır.Basit korelasyon işlemlerinde kullanılır. Grafik çizimi işlem sırası:Grafik çizimi işlem sırası: –Eksenlerin belirlenmesi –Uygun ölçek seçimi –Verilerin yerleştirilmesi –Lineer grafik elde edilmesi –Eğim bulunması Grafik Analizi

47 Eksenlerin belirlenmesi Serbest değişken (birim) Bağlı değişken(birim)

48 Ölçek Seçimi Hacim Kütle Her iki ölçek uygun değil

49 Ölçek Seçimi Hacim Kütle Y ölçeği uygun değil

50 Ölçek Seçimi X ölçeği uygun değil Hacim Kütle

51 Ölçek Seçimi Hacim Kütle Uygun ölçek seçimi

52 Doğru çizimi Hacim Kütle Doğru çizim Yanlış çizim

53 Doğru çizimi Hacim Kütle Yanlış çizim Doğru çizim

54 Eğim Bulunması Zaman Hız Eğim= Hız/zaman = Tan  ! Dikkat!


"İstatistikte Bazı Temel Kavramlar Evren Evren –Gözlem alanına giren obje ya da bireylerin tümü Örneklem Örneklem –Bir evrenden seçilmiş daha küçük sayıdaki." indir ppt

Benzer bir sunumlar


Google Reklamları