Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Teknoloji Fakültesi Mekatronik MTM326 Veri Toplama ve İşleme

Benzer bir sunumlar


... konulu sunumlar: "Teknoloji Fakültesi Mekatronik MTM326 Veri Toplama ve İşleme"— Sunum transkripti:

1 Teknoloji Fakültesi Mekatronik MTM326 Veri Toplama ve İşleme
Karabük Üniversitesi Teknoloji Fakültesi Mekatronik Mühendisliği Bölümü MTM326 Veri Toplama ve İşleme Arş. Gör. Dr. Emel SOYLU

2 Deneysel veri üzerinde istatistiksel işlemler

3 Ayrık frekans dağılımları
Varsayalım ki 10 tane ölçümümüz var, ve bu ölçümler xi(x1,x2,….x10) aşağıdaki gibi yapılmış olsun. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 14 16 13 19 18 15 Görülüğü üzere burada ölçüm aralığı 13 ile 19 arasında olduğundan 6’dır.

4 Frekans j. Ölçümün kaç defa meydana geldiğinin sayısıdır.
Frekans F (nj) Frekans j. Ölçümün kaç defa meydana geldiğinin sayısıdır. Örneğimizdeki frekanslar; j 1 2 3 4 5 6 7 değer 13 14 15 16 17 18 19 nj

5 𝑛= 𝑗=1 𝑚 𝑛 𝑗 𝑓 𝑗 = 𝑛 𝑗 𝑛 𝑗=1 𝑚 𝑓 𝑗 =1 Göreceli Frekans fj
Göreceli frekans; değerin kaç kere meydana geldiğinin toplam değe sayısına oranıdır. 𝑛= 𝑗=1 𝑚 𝑛 𝑗 𝑓 𝑗 = 𝑛 𝑗 𝑛 𝑗=1 𝑚 𝑓 𝑗 =1 Örneğimizde 7 grup var, m=7 j 1 2 3 4 5 6 7 değer 13 14 15 16 17 18 19 nj fj 0,1 0,3 0,2 0,0

6 j 1 2 3 4 5 6 7 değer 13 14 15 16 17 18 19 fj 0,1 0,3 0,2 0,0 Frekans Grafiği: Bu ölçümler "Frekans Grafiği" adlı bir histogram üzerinde grafiksel olarak aşağıdaki gibi gösterilebilir: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 14 16 13 19 18 15

7 𝒙 = 𝟏 𝒏 𝒊=𝟏 𝒏 𝒙 𝒊 𝑥 𝑥 Merkezi Eğilim Ölçüleri
Aritmetik ortalama, bir sayı serisindeki sayıların toplamının serinin eleman sayısına (sayı adedine) bölünmesi sonucu elde edilen değerdir. Aritmetik Ortalama (Ortalama) 𝒙 = 𝟏 𝒏 𝒊=𝟏 𝒏 𝒙 𝒊 𝑥 En yaygın kullanılan merkezi eğilim ölçüsüdür, çünkü genellikle veri dağılımındaki en tipik değerin “en iyi tahminini” sağlar. 𝑥 Son örnek için =15.6’dır. Bias istatistikte sistematik hata yapma eğilimidir.

8 Medyan (Ortanca) Nedir?
Medyan, bir sayısal veri serisi sıralandığında ortada kalan sayıdır. Örneğin 2, 1, 5, 4, 5, 1, 2, 3, 5 serisi sıralanırsa 1, 1, 2, 2, 3, 4, 5, 5, 5 serisi elde edilir. Bu seri 9 elemanlı olduğundan ortadaki, yani 5. eleman (medyan) olacaktır. 5. eleman 3 sayısıdır. Eleman sayısı tek sayı olan bir seride medyan değerin sırasının hesaplaması şu şekilde formüle edilir. Medyanın Sırası = (Eleman Sayısı + 1) / 2 Bu formülü yukarıdaki örneği uygulayacak olursak; Medyanın Sırası = (9 + 1) / 2 = 5

9 Veri serisi eleman sayısı bir çift sayı ise bu durumda serinin 2 medyanı olacaktır. Örneğin 2, 1, 5, 4, 5, 1, 2, 3, 5, 4 serisi sıralandığında 1, 1, 2, 2, 3, 4, 4, 5, 5, 5 serisi elde edilir. Seri 10 elemanlı olduğundan medyan 2 sayı olacaktır. Bunlar ortadaki 3 ve 4 sayılarıdır. Eleman sayısı çift sayı olan bir seride medyan değerlerin sıralarının hesaplanması şu şekilde formüle edilir. 1. Medyanın Sırası = Eleman Sayısı / 2 2. Medyanın Sırası = Eleman Sayısı / 2 + 1 Medyan

10 Mod (Tepe Değer) Nedir? Bu örnekte mod 14’tür.
Mod, bir sayısal veri serisi içinde en çok tekrar eden sayıdır. Bu sayının tekrar adedine de frekans denir. Örneğin 1, 5, 4, 5, 1, 3, 5 serisinde en çok tekrar eden sayı 5 sayısıdır ve frekansı 3'tür (3 kez tekrar etmiş). Bazi serilerin 2 modu olabilir. Örneğin 1, 5, 4, 5, 3, 4, 5, 2, 3, 4 serisinde 4 ve 5 sayıları 3'er kez tekrar etmişlerdir. Bu durumda bu serinin 4 ve 5 olmak üzere iki modu vardır. Bu örnekte mod 14’tür.

11 Mod, medyan, aritmetik ortalama ve standart sapma ne işe yarar?
İstatistikte kullanılan bu hesaplamaların tamamına Merkezi Eğilim Ölçüleri denir. Bunların hepsinde elde edilen sonuçların verilerin merkezine olan uzaklığı dikkate alınır. Bu şekilde serideki her bir veri veya serinin tamamı hakkında bazı kararlar verilir. Merkezi eğilim ölçülerine ortalamalar da diyebiliriz. Her bir yöntem farklı bir şekilde ortalama alır.

12 Mod, medyan, aritmetik ortalama ve standart sapma ne işe yarar?
Bir çok eğilim ölçüsü olmasının sebebi şudur: Seriler birbirinden farklı özellikler gösterir. Örneğin bir seride serideki diğer değerlerden çok farklı olan değerler bulunabilir. 2, 2, 4, 6, 8, 1000 gibi bir seride 1000 değeri diğerlerinden çok farklıdır. Bu durumda aritmetik ortalamanın bize çok bir faydası olmaz. Bunların kişilerin elde ettiği gelirler olduğunu düşündüğünüzde, bu toplumun ortalama gelirinin 170 TL olduğunu söylememiz, toplumun çok büyük bir kesimi bu gelirin çok altında kaldığından doğru bir çıkarım olmaz. Bu çıkarıma dayanarak kişilerin maaşlarına aynı oranda zam yaptığımızda büyük bir adaletsizliğe sebep oluruz. Sonuç olarak böyle bir dizide aritmetik ortalama yerine mod, medyan veya standart sapmayı kullanmak daha uygun olabilir.

13 𝑥 𝑔 = ( 𝜋 𝑖=1 𝑛 𝑥 𝑖 ) 1/𝑛 Geometrik Ortalama (Log-Mean)
Tek bir sütun halindeki, sınıflandırılmamış serilerde terimleri (Xi) birbiriyle çarpmak ve çarpımın terim sayısınca kökünü almak suretiyle bulunur. 𝑥 𝑔 = ( 𝜋 𝑖=1 𝑛 𝑥 𝑖 ) 1/𝑛 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 14 16 13 19 18 15 Oranlar ve yüzdeleri kullanırken önem arzeder. Örneğimiz için bu değer 15.5’tir.

14 Harmonik Ortalama Örneğimiz için bu değer 15.4’tür.

15 Quadratik Ortalama (Kök-Orta-Kare) Bir veri setinin orijinden sonraki ikinci anı olarak düşünülebilir. (Son örnek için 15.7)

16 Veri Dağılım Ölçümleri
Varyans (Son örnek için 3.84)

17 Standart Sapma Nedir? Standart Sapma Nasıl Hesaplanır?
Standart sapma, bir serisdeki sayıların, serinin aritmetik ortalamasından farklarının karelerinin toplamının dizinin eleman sayısının bir eksiğine bölümünün kareköküdür. Biraz açmak gerekirse, stantart sapma hesaplamak için; Sayıların aritmetik ortalaması hesaplanır. Her bir sayının aritmetik ortalamadan farkı bulunur. Bulunan farkların her birinin karesi hesaplanır. Farkların kareleri toplanır. Elde edilen toplam, serinin eleman sayısının bir eksiğine bölünür. Bulunan sayının karekökü alınır.

18 Standart Sapma (Son örnek için 1.96) Range-Aralık Veri setindeki en büyük değer ile en küçük değer arasındaki farktır.(Son örnek için 6)

19 Standart sapma ile verilerin ne kadarının ortalamaya yakın olduğunu buluruz. Eğer standart sapma küçükse veriler ortalamaya yakın yerlerde dağılmışlardır. Bunun tersi olarak standart sapma büyükse veriler ortalamadan uzak yerlerde dağılmışlardır. Bütün değerler aynı olursa standart sapma sıfır olur. Bir örnekle açıklayalım. İki tane veri dizimiz olsun. Veri dizilerinden bir tanesinin elemanlarının   90, 70, 80 ve 80 olduğunu, diğerinin ise 10, 30, 80 ve 200

20 olduğunu varsayalım. Bu iki dizinin de ortalamaları 80'dir
olduğunu varsayalım. Bu iki dizinin de ortalamaları 80'dir. Ancak birinci dizinin dağılımının daha düzgün olduğu açıkça görülmektedir. Herhangi bir ölçüm için kullanılan bu dizinin standart sapması, elemanların bir çoğu ortalamaya yakın olduğundan küçük çıkacaktır. İkinci dizide ise elemanların bir çoğunun ortalamadan uzak değerler aldığı görülüyor. Bu dizinin de standart sapması büyük çıkacaktır. Dolayısıyla buradan birinci dizideki verinin daha güvenilir ve dengeli olduğunu söyleyebiliriz. Örnekteki birinci dizinin standart sapması 8,16.., ikinci dizinin standart sapması ise 85,24... bulunur. Bu dizilerin bir sınıftaki öğrencilerin notları olduğunu varsayarsak ilk sınıftaki öğrencilerin notları daha istikrarlıdır ve öğrencileri daha başarılıdır diyebiliriz. Zaten ikinci dizideki (sınıftaki) 100 değerini çıkardığınızda ortalamanın 40'a (diğer sınıfın yarısı) düştüğü görülür.

21 yine bu dizideki değerlerin iki marketin günlük satış tutarları olduğunu varsayarsak, birinci marketin verilerin ölçüldüğü zaman dilimi içindeki satışlarının ikinci marketten daha iyi olduğunu söyleyebiliriz. Standart sapma bize verilerin ne kadar düzgün ve dengeli dağıldığını gösterir. Görüldüğü gibi stantart sapmayı dizi ile ilgili tanı koyma ve dolayısıyla bazı kararlar almada kullanabiliriz. Tabiki standart sapma daha büyük veri dizilerinde kullanıldığında daha fazla işimize yarayacaktır.

22 Ortalama Sapma Son örnek için 1.72

23 Örnek x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 5 4 3 2 10 6 7 8 Frekans dağılım tablosunu oluşturunuz. Geometrik Ortalama Göreceli frekans tablosunu oluşturunuz. Harmonik Frekans grafiğini çiziniz. Quadratik Aritmetik Ortalama Varyans Mod Standart sapma Medyan Ortalama sapma

24 MATLAB’de genel istatistik işlemleri

25 MATLAB’de genel istatistik işlemleri
max : Verilerin en büyük değerini bulur min : Verilerin en küçük değerini bulur length : Veri sayısını bulur sum : Verilerin toplamını hesaplar prod : Verilerin çarpımını hesaplar median : Verilerin ortanca değeri hesaplar std : Verilerin standart sapmasını hesaplar mean : Verilerin ortalama değerini hesaplar yani aritmetik ortalama alır geomean : Verilerin geometrik ortasını hesaplar harmmean : Verilerin harmonik ortasını hesaplar sort : Verilerin azalan sırada sıralar

26 Örnek Kod d=[ ] ; disp('En Büyük : ' ); max(d) disp('En Küçük : '); min(d) disp('Toplam Eleman : ' ); length(d) disp('Dizi Toplamı: ' ); sum(d) disp('Dizi Çarpımı : ' ); prod(d) disp('Ortanca : ' ); median(d) disp('Standart Sapma : ' ); std(d) disp('Ortalama : ' ); mean(d) disp('Geometrik Ortalama : ' ); geomean(d) disp('Harmonik Ortalama : ' ); harmmean(d) disp('Sıralanmış Hali: ' ); sort(d)

27 Program Çıktıları d=[0.5 1 0.34 2.5 2.5 1.14 3.0 3.4 5 6.5 4.31 5.5] ;
En Büyük : En Küçük : Toplam Eleman : 12 Dizi Toplamı: Dizi Çarpımı : e+03 Ortanca : Standart Sapma : Ortalama : Geometrik Ortalama : Harmonik Ortalama : Sıralanmış Hali:

28 Matlab’de bu veri setinin
Örnek; x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 0,1 0,3 0,2 0,4 0,5 Matlab’de bu veri setinin Verilerin en büyük değerini bulunuz. Verilerin en küçük değerini bulunuz. Veri sayısını bulunuz. Verilerin toplamını hesaplayınız. Verilerin çarpımını hesaplayınız. Verilerin ortanca değeri hesaplayınız. Verilerin standart sapmasını hesaplayınız. Verilerin ortalama değerini hesaplayınız. Verilerin geometrik ortasını hesaplayınız. Verilerin harmonik ortasını hesaplayınız. Verilerin azalan sırada sıralayınız.

29 Kaynak: Asst. Prof. Dr. E. İlhan KONUKSEVEN Ders notları


"Teknoloji Fakültesi Mekatronik MTM326 Veri Toplama ve İşleme" indir ppt

Benzer bir sunumlar


Google Reklamları