Teknoloji Fakültesi Mekatronik MTM326 Veri Toplama ve İşleme

Slides:



Advertisements
Benzer bir sunumlar
SAYISAL DEVRELER BÖLÜM-2 Sayı Sistemleri ve Kodlar
Advertisements

Determinant Bir kare matrisin tersinir olup olmadığına dair bilgi veriyor n- boyutlu uzayda matrisin satırlarından oluşmuş bir paralel kenarın hacmine.
% A10 B20 C30 D25 E15 Toplam100.  Aynı grafik türü (Column-Sütun) iki farklı veri grubu için de kullanılabilir. 1. Sınıflar2. Sınıflar A1015 B20 C3015.
3. HAFTA 03 Mart MATEMATİKSEL İŞLEMLER Aritmetik Islemlerde Öncelik Durumu.
Merkezi Eğilim Ölçüleri (Ortalamalar)
ÖTÖ 451 Okul Yönetiminde Bilgisayar Uygulamaları R. Orçun Madran.
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ. BAĞIMSIZ GRUPLARA İLİŞKİN HİPOTEZ TESTLERİ.
Örnek 1 Kullanıcının girdiği bir sayının karesini hesaplayan bir program yazınız.
MED 167 Making Sense of Numbers Değişkenlik Ölçüleri.
OLASILIK TEOREMLERİ Permütasyon
VERİ ANALİZİ Nicel Veri Analizi Nitel Veri Analizi Betimsel İstatistik
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
ÇARPMA İŞLEMİ X x x x xx x.
Prof. Dr. M. Tunç ÖZCAN Tarım Makinaları Bölümü
OLASILIK ve İSTATİSTİK
Temel Matematik 2 Diziler ve Seriler Temel Matematik 2 Diziler ve Seriler Ocak 2016 İ stanbul Üniversitesi Prof. Dr. Ergün Ero ğ lu İ Ü İ şletme Fakültesi.
Excel 2007.
Sürekli Olasılık Dağılımları
Istatistik I Fırat Emir.
Ölçme Değerlendirmede İstatistiksel İşlemler
TABLO ve GRAFİK YAPIM YÖNTEMİ
İÇİNDEKİLER NEGATİF ÜS ÜSSÜ SAYILARIN ÖZELLİKLERİ
Sıklık Dağılımları Yrd. Doç. Dr. Emine Cabı.
İŞLU İstatistik -Ders 2-.
ISTATİSTİK I FIRAT EMİR DERS II.
PARANIN ZAMAN DEĞERİ.
SPSS’te Temel İstatistikler
TAM SAYILAR.
T- Testİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ
Basit ve Kısmi Korelasyon Dr. Emine Cabı
BM-103 Programlamaya Giriş Güz 2016 (7. Sunu)
Problem Çözme ve Algoritmalar
1. Bernoulli Dağılımı Bernoulli dağılımı rassal bir deneyin sadece iyi- kötü, olumlu-olumsuz, başarılı-başarısız, kusurlu-kusursuz gibi sadece iki sonucu.
Temel Matematik 2 9-Seriler Ocak 2016 İstanbul Üniversitesi
APARTMANLAR OYUNU NEDİR?
DOĞAL SAYILAR TAM SAYILAR
Ünite 9: Korelasyon Öğr. Elemanı: Dr. M. Cumhur AKBULUT.
MAT – 101 Temel Matematik Mustafa Sezer PEHLİVAN *
TANIMLAYICI İSTATİSTİKLER
Mutlak Dağılım Ölçüleri Nispi Dağılım Ölçüleri
İŞ SAĞLIĞI VE GÜVENLİĞİ KARŞILAŞTIRMA ÖLÇÜTLERİ
DEĞİŞKENLİK ÖLÇÜLERİ.
TEST VE MADDE İSTATİSTİKLERİ
MATEMATİK ORAN ORANTI.
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
PARANIN ZAMAN DEĞERİ.
İSTATİSTİK Yrd. Doç. Dr. Cumhur TÜRK
385 kişiye yapılan anket soruları aşağıdaki verilmiştir.
PARAMETRİK HİPOTEZ TESTLERİ
NİŞANTAŞI ÜNİVERSİTESİ
Ölçme Değerlendirmede İstatistiksel İşlemler
Test Puanlarının Yorumlanması: Standart Puanlar
B- Yaygınlık Ölçüleri Standart Sapma ve Varyans Değişim Katsayısı
İletişim Fakültesi Bilişim A.B.D.
Sonlu Özdevinirlere Giriş
NİŞANTAŞI ÜNİVERSİTESİ
Bilgisayar II 8 Mart Mart
Değerler ve Değişkenler
Ölçme Sonuçları Üzerinde Test ve Madde İstatistiklerini Hesaplama
HİPOTEZ TESTLERİ.
NİŞANTAŞI ÜNİVERSİTESİ
NİŞANTAŞI ÜNİVERSİTESİ
Kesikli Olay benzetimi Bileşenleri
TYS102 ÖLÇME BİLGİSİ Yrd. Doç. Dr. N. Yasemin EMEKLİ
İleri Algoritma Analizi
OLASILIK Uygulamada karşılaşılan olayların birçoğu kesin olmayan diğer bir ifadeyle belirsizlik içeren bir yapıya sahiptir. Olasılık kavramı kesin olmayan.
RASTGELE DEĞİŞKENLER Herhangi bir özellik bakımından birimlerin almış oldukları farklı değerlere değişken denir. Rastgele değişken ise tanım aralığında.
NİŞANTAŞI ÜNİVERSİTESİ
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
Sunum transkripti:

Teknoloji Fakültesi Mekatronik MTM326 Veri Toplama ve İşleme Karabük Üniversitesi Teknoloji Fakültesi Mekatronik Mühendisliği Bölümü MTM326 Veri Toplama ve İşleme Arş. Gör. Dr. Emel SOYLU

Deneysel veri üzerinde istatistiksel işlemler

Ayrık frekans dağılımları Varsayalım ki 10 tane ölçümümüz var, ve bu ölçümler xi(x1,x2,….x10) aşağıdaki gibi yapılmış olsun. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 14 16 13 19 18 15 Görülüğü üzere burada ölçüm aralığı 13 ile 19 arasında olduğundan 6’dır.

Frekans j. Ölçümün kaç defa meydana geldiğinin sayısıdır. Frekans F (nj) Frekans j. Ölçümün kaç defa meydana geldiğinin sayısıdır. Örneğimizdeki frekanslar; j 1 2 3 4 5 6 7 değer 13 14 15 16 17 18 19 nj

𝑛= 𝑗=1 𝑚 𝑛 𝑗 𝑓 𝑗 = 𝑛 𝑗 𝑛 𝑗=1 𝑚 𝑓 𝑗 =1 Göreceli Frekans fj Göreceli frekans; değerin kaç kere meydana geldiğinin toplam değe sayısına oranıdır. 𝑛= 𝑗=1 𝑚 𝑛 𝑗 𝑓 𝑗 = 𝑛 𝑗 𝑛 𝑗=1 𝑚 𝑓 𝑗 =1 Örneğimizde 7 grup var, m=7 j 1 2 3 4 5 6 7 değer 13 14 15 16 17 18 19 nj fj 0,1 0,3 0,2 0,0

j 1 2 3 4 5 6 7 değer 13 14 15 16 17 18 19 fj 0,1 0,3 0,2 0,0 Frekans Grafiği: Bu ölçümler "Frekans Grafiği" adlı bir histogram üzerinde grafiksel olarak aşağıdaki gibi gösterilebilir: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 14 16 13 19 18 15

𝒙 = 𝟏 𝒏 𝒊=𝟏 𝒏 𝒙 𝒊 𝑥 𝑥 Merkezi Eğilim Ölçüleri Aritmetik ortalama, bir sayı serisindeki sayıların toplamının serinin eleman sayısına (sayı adedine) bölünmesi sonucu elde edilen değerdir. Aritmetik Ortalama (Ortalama) 𝒙 = 𝟏 𝒏 𝒊=𝟏 𝒏 𝒙 𝒊 𝑥 En yaygın kullanılan merkezi eğilim ölçüsüdür, çünkü genellikle veri dağılımındaki en tipik değerin “en iyi tahminini” sağlar. 𝑥 Son örnek için =15.6’dır. Bias istatistikte sistematik hata yapma eğilimidir.

Medyan (Ortanca) Nedir? Medyan, bir sayısal veri serisi sıralandığında ortada kalan sayıdır. Örneğin 2, 1, 5, 4, 5, 1, 2, 3, 5 serisi sıralanırsa 1, 1, 2, 2, 3, 4, 5, 5, 5 serisi elde edilir. Bu seri 9 elemanlı olduğundan ortadaki, yani 5. eleman (medyan) olacaktır. 5. eleman 3 sayısıdır. Eleman sayısı tek sayı olan bir seride medyan değerin sırasının hesaplaması şu şekilde formüle edilir. Medyanın Sırası = (Eleman Sayısı + 1) / 2 Bu formülü yukarıdaki örneği uygulayacak olursak; Medyanın Sırası = (9 + 1) / 2 = 5

Veri serisi eleman sayısı bir çift sayı ise bu durumda serinin 2 medyanı olacaktır. Örneğin 2, 1, 5, 4, 5, 1, 2, 3, 5, 4 serisi sıralandığında 1, 1, 2, 2, 3, 4, 4, 5, 5, 5 serisi elde edilir. Seri 10 elemanlı olduğundan medyan 2 sayı olacaktır. Bunlar ortadaki 3 ve 4 sayılarıdır. Eleman sayısı çift sayı olan bir seride medyan değerlerin sıralarının hesaplanması şu şekilde formüle edilir. 1. Medyanın Sırası = Eleman Sayısı / 2 2. Medyanın Sırası = Eleman Sayısı / 2 + 1 Medyan

Mod (Tepe Değer) Nedir? Bu örnekte mod 14’tür. Mod, bir sayısal veri serisi içinde en çok tekrar eden sayıdır. Bu sayının tekrar adedine de frekans denir. Örneğin 1, 5, 4, 5, 1, 3, 5 serisinde en çok tekrar eden sayı 5 sayısıdır ve frekansı 3'tür (3 kez tekrar etmiş). Bazi serilerin 2 modu olabilir. Örneğin 1, 5, 4, 5, 3, 4, 5, 2, 3, 4 serisinde 4 ve 5 sayıları 3'er kez tekrar etmişlerdir. Bu durumda bu serinin 4 ve 5 olmak üzere iki modu vardır. Bu örnekte mod 14’tür.

Mod, medyan, aritmetik ortalama ve standart sapma ne işe yarar? İstatistikte kullanılan bu hesaplamaların tamamına Merkezi Eğilim Ölçüleri denir. Bunların hepsinde elde edilen sonuçların verilerin merkezine olan uzaklığı dikkate alınır. Bu şekilde serideki her bir veri veya serinin tamamı hakkında bazı kararlar verilir. Merkezi eğilim ölçülerine ortalamalar da diyebiliriz. Her bir yöntem farklı bir şekilde ortalama alır.

Mod, medyan, aritmetik ortalama ve standart sapma ne işe yarar? Bir çok eğilim ölçüsü olmasının sebebi şudur: Seriler birbirinden farklı özellikler gösterir. Örneğin bir seride serideki diğer değerlerden çok farklı olan değerler bulunabilir. 2, 2, 4, 6, 8, 1000 gibi bir seride 1000 değeri diğerlerinden çok farklıdır. Bu durumda aritmetik ortalamanın bize çok bir faydası olmaz. Bunların kişilerin elde ettiği gelirler olduğunu düşündüğünüzde, bu toplumun ortalama gelirinin 170 TL olduğunu söylememiz, toplumun çok büyük bir kesimi bu gelirin çok altında kaldığından doğru bir çıkarım olmaz. Bu çıkarıma dayanarak kişilerin maaşlarına aynı oranda zam yaptığımızda büyük bir adaletsizliğe sebep oluruz. Sonuç olarak böyle bir dizide aritmetik ortalama yerine mod, medyan veya standart sapmayı kullanmak daha uygun olabilir.

𝑥 𝑔 = ( 𝜋 𝑖=1 𝑛 𝑥 𝑖 ) 1/𝑛 Geometrik Ortalama (Log-Mean) Tek bir sütun halindeki, sınıflandırılmamış serilerde terimleri (Xi) birbiriyle çarpmak ve çarpımın terim sayısınca kökünü almak suretiyle bulunur. 𝑥 𝑔 = ( 𝜋 𝑖=1 𝑛 𝑥 𝑖 ) 1/𝑛 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 14 16 13 19 18 15 Oranlar ve yüzdeleri kullanırken önem arzeder. Örneğimiz için bu değer 15.5’tir.

Harmonik Ortalama Örneğimiz için bu değer 15.4’tür.

Quadratik Ortalama (Kök-Orta-Kare) Bir veri setinin orijinden sonraki ikinci anı olarak düşünülebilir. (Son örnek için 15.7)

Veri Dağılım Ölçümleri Varyans (Son örnek için 3.84)

Standart Sapma Nedir? Standart Sapma Nasıl Hesaplanır? Standart sapma, bir serisdeki sayıların, serinin aritmetik ortalamasından farklarının karelerinin toplamının dizinin eleman sayısının bir eksiğine bölümünün kareköküdür. Biraz açmak gerekirse, stantart sapma hesaplamak için; Sayıların aritmetik ortalaması hesaplanır. Her bir sayının aritmetik ortalamadan farkı bulunur. Bulunan farkların her birinin karesi hesaplanır. Farkların kareleri toplanır. Elde edilen toplam, serinin eleman sayısının bir eksiğine bölünür. Bulunan sayının karekökü alınır.

Standart Sapma (Son örnek için 1.96) Range-Aralık Veri setindeki en büyük değer ile en küçük değer arasındaki farktır.(Son örnek için 6)

Standart sapma ile verilerin ne kadarının ortalamaya yakın olduğunu buluruz. Eğer standart sapma küçükse veriler ortalamaya yakın yerlerde dağılmışlardır. Bunun tersi olarak standart sapma büyükse veriler ortalamadan uzak yerlerde dağılmışlardır. Bütün değerler aynı olursa standart sapma sıfır olur. Bir örnekle açıklayalım. İki tane veri dizimiz olsun. Veri dizilerinden bir tanesinin elemanlarının   90, 70, 80 ve 80 olduğunu, diğerinin ise 10, 30, 80 ve 200

olduğunu varsayalım. Bu iki dizinin de ortalamaları 80'dir olduğunu varsayalım. Bu iki dizinin de ortalamaları 80'dir. Ancak birinci dizinin dağılımının daha düzgün olduğu açıkça görülmektedir. Herhangi bir ölçüm için kullanılan bu dizinin standart sapması, elemanların bir çoğu ortalamaya yakın olduğundan küçük çıkacaktır. İkinci dizide ise elemanların bir çoğunun ortalamadan uzak değerler aldığı görülüyor. Bu dizinin de standart sapması büyük çıkacaktır. Dolayısıyla buradan birinci dizideki verinin daha güvenilir ve dengeli olduğunu söyleyebiliriz. Örnekteki birinci dizinin standart sapması 8,16.., ikinci dizinin standart sapması ise 85,24... bulunur. Bu dizilerin bir sınıftaki öğrencilerin notları olduğunu varsayarsak ilk sınıftaki öğrencilerin notları daha istikrarlıdır ve öğrencileri daha başarılıdır diyebiliriz. Zaten ikinci dizideki (sınıftaki) 100 değerini çıkardığınızda ortalamanın 40'a (diğer sınıfın yarısı) düştüğü görülür.

yine bu dizideki değerlerin iki marketin günlük satış tutarları olduğunu varsayarsak, birinci marketin verilerin ölçüldüğü zaman dilimi içindeki satışlarının ikinci marketten daha iyi olduğunu söyleyebiliriz. Standart sapma bize verilerin ne kadar düzgün ve dengeli dağıldığını gösterir. Görüldüğü gibi stantart sapmayı dizi ile ilgili tanı koyma ve dolayısıyla bazı kararlar almada kullanabiliriz. Tabiki standart sapma daha büyük veri dizilerinde kullanıldığında daha fazla işimize yarayacaktır.

Ortalama Sapma Son örnek için 1.72

Örnek x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 5 4 3 2 10 6 7 8 Frekans dağılım tablosunu oluşturunuz. Geometrik Ortalama Göreceli frekans tablosunu oluşturunuz. Harmonik Frekans grafiğini çiziniz. Quadratik Aritmetik Ortalama Varyans Mod Standart sapma Medyan Ortalama sapma

MATLAB’de genel istatistik işlemleri

MATLAB’de genel istatistik işlemleri max : Verilerin en büyük değerini bulur min : Verilerin en küçük değerini bulur length : Veri sayısını bulur sum : Verilerin toplamını hesaplar prod : Verilerin çarpımını hesaplar median : Verilerin ortanca değeri hesaplar std : Verilerin standart sapmasını hesaplar mean : Verilerin ortalama değerini hesaplar yani aritmetik ortalama alır geomean : Verilerin geometrik ortasını hesaplar harmmean : Verilerin harmonik ortasını hesaplar sort : Verilerin azalan sırada sıralar

Örnek Kod d=[0.5 1 0.34 2.5 2.5 1.14 3.0 3.4 5 6.5 4.31 5.5] ; disp('En Büyük : ' ); max(d) disp('En Küçük : '); min(d) disp('Toplam Eleman : ' ); length(d) disp('Dizi Toplamı: ' ); sum(d) disp('Dizi Çarpımı : ' ); prod(d) disp('Ortanca : ' ); median(d) disp('Standart Sapma : ' ); std(d) disp('Ortalama : ' ); mean(d) disp('Geometrik Ortalama : ' ); geomean(d) disp('Harmonik Ortalama : ' ); harmmean(d) disp('Sıralanmış Hali: ' ); sort(d)

Program Çıktıları d=[0.5 1 0.34 2.5 2.5 1.14 3.0 3.4 5 6.5 4.31 5.5] ; En Büyük : 6.5000 En Küçük : 0.3400 Toplam Eleman : 12 Dizi Toplamı: 35.6900 Dizi Çarpımı : 9.5183e+03 Ortanca : 2.7500 Standart Sapma : 2.0372 Ortalama : 2.9742 Geometrik Ortalama : 2.1456 Harmonik Ortalama : 1.3313 Sıralanmış Hali: 0.3400 0.5000 1.0000 1.1400 2.5000 2.5000 3.0000 3.4000 4.3100 5.0000 5.5000 6.5000

Matlab’de bu veri setinin Örnek; x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 0,1 0,3 0,2 0,4 0,5 Matlab’de bu veri setinin Verilerin en büyük değerini bulunuz. Verilerin en küçük değerini bulunuz. Veri sayısını bulunuz. Verilerin toplamını hesaplayınız. Verilerin çarpımını hesaplayınız. Verilerin ortanca değeri hesaplayınız. Verilerin standart sapmasını hesaplayınız. Verilerin ortalama değerini hesaplayınız. Verilerin geometrik ortasını hesaplayınız. Verilerin harmonik ortasını hesaplayınız. Verilerin azalan sırada sıralayınız.

Kaynak: Asst. Prof. Dr. E. İlhan KONUKSEVEN Ders notları