Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

1 SU KALİTESİ VERİLERİNİN İSTATİSTİKSEL YÖNTEMLERLE DEĞERLENDİRİLMESİ Doç. Dr. Hülya Boyacıoğlu Dokuz Eylül Üniversitesi Çevre Mühendisliği Bölümü

Benzer bir sunumlar


... konulu sunumlar: "1 SU KALİTESİ VERİLERİNİN İSTATİSTİKSEL YÖNTEMLERLE DEĞERLENDİRİLMESİ Doç. Dr. Hülya Boyacıoğlu Dokuz Eylül Üniversitesi Çevre Mühendisliği Bölümü"— Sunum transkripti:

1 1 SU KALİTESİ VERİLERİNİN İSTATİSTİKSEL YÖNTEMLERLE DEĞERLENDİRİLMESİ Doç. Dr. Hülya Boyacıoğlu Dokuz Eylül Üniversitesi Çevre Mühendisliği Bölümü

2 2 KAPSAM Giriş (Su kalite verilerinin özellikleri) Su Kalite verilerinin değerlendirilmesi Grafiksel analiz Tanımlayıcı istatistikler Uygulama örnekleri

3 3 GİRİŞ Su kalitesinin izlenmesi ve değerlendirilmesi Veri toplama ve değerlendirme amacının ortaya konması ve örneklem tasarımı Ön değerlendirme İstatistiksel yöntemin belirlenmesi İstatistiksel yöntemin tahminlerinin doğrulanması/değerlendirilmesi Sonuç çıkarsanması GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

4 4 Hangi kalite değişkeninin değerlendireceğim. Veriler hangi zaman aralığında, ne sıklıkta analizlenmiş? Hangi soruya yanıt arıyorum? Ortalama su kalite değeri Su kalitesinin değişimi Yüksek yüzde değerleri (örneğin %95 değeri) Gözlem sahaları ortalama değerleri kıyası Gözlem sahaları yüksek yüzde değerleri kıyası Su kalitesi ile ilişkiler? (sıcaklık, deşarj) GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

5 5 Su Kalite Veri Özellikleri Verilerin alt sınır değeri 0. Negatif değer gözlenmez. Aykırı (sapan) değerler (outlier). Genellikle yüksek değerler tarafındadır (dikkate alınmazsa sonuçlar farklı yorumlanır) Normal olmayan dağılım. Sağ tarafta yer alan kuyruklar (çarpıklık). Genelde simetrik olmayan, çarpıklık gösteren veri setleri Mevsimsellik gösteren veri setleri (bazı kalite değişkenleri yaz aylarında daha yüksek değerler alır ) Otokorelasyon (örn. Akarsu boyunca yer alan yakın istasyonlardan alınan örnekler, aynı istasyondan kısa zaman aralıklarında alınan örnekler ilişkili olabilir) GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

6 6 Aykırı (Sapan) değerler Aykırı değerler (outlier).-Net tanımı henüz yapılmamış ancak veri setinde normal olmayan değer(ler) olarak değerlendirilebilir. Veri setinden değerlendirme başlamadan çıkarılabilir. Yazım hatası olup olmadığına bakılabilir Örneklem seti düşünülenden daha karmaşık olabilir ve aykırı değer bunun sonucu olabilir. Aykırı değerleri içeren ve içermeyen veri setleriyle analiz yapılıp sonuçlar kıyaslanır ve sonuç farklı değilse veri setinde değerler kalabilir. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

7 7 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

8 8 Eksik veriler Tamamen raslantısal eksiklik (numune şişesinin kırılması vb) Raslantısal eksiklik (kötü hava koşulları nedeniyle arazide numune alınamaması) Ölçüm cihazı analiz limitlerinin dışında gözlenen konsantrasyonlar GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

9 9 VERİLERİN DEĞERLENDİRİLMESİ Tanımlayıcı istatistikler Grafiksel analizler GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

10 10 Zaman serisi grafiği GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

11 11 Değişkenlerin birbirleri arasındaki ilişkileri gösteren grafiklerdir. İlişkinin var olup olmadığını ve yönünün tespit edilmesinde kullanılır. Sayısal bir değer ile ifade edilmez. Serpme grafiği GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

12 12 Histogramlar Veriyi gruplara ayırarak anlaşılabilir hale getirmek için Gözlenme sıklıklarını ve olasılıklarını belirlemek için histogramlar çizilir. k: sınıf sayısı, n: örneklem büyüklüğü 2 k > n SınıffKüm fRel fKüm Rel f GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

13 13 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

14 14 Verinin bütününü bir nitelik değerine göre görüntüleme Veri setindeki tüm değerleri görüntüleme „ Veri bir nitelik değerine göre küçükten büyüğe doğru sıralanır „ xi değeri için Fi miktardaki veri xi değerinden küçük ya da eşittir Quantile Plot GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

15 15 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

16 16 Box Plot-Kutu Grafiği GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

17 17 Box Plot-Kutu Grafiği GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

18 18 Box Plot-Kutu Grafiği GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

19 19 TANIMLAYICI İSTATİSTİKLER Bir veri setini tanımak veya birden fazla veri setini karşılaştırmak için kullanılan ve ayrıca örnek verilerinden hareket ile frekans dağılışlarını sayısal olarak özetleyen değerlere tanımlayıcı istatistikler denir. Analizlerde kullanılan veri tiplerine (basit, gruplanmış, sınıflanmış) göre hesaplamalarda kullanılacak formüller değişmektedir. Yer Ölçüleri Değişkenlik Ölçüleri Çarpıklık Ölçüleri Basıklık Ölçüleri GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

20 20 Tanımlayıcı istatistikler GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

21 21 Tanımlayıcı istatistikler Merkezi Eğilim Ölçüleri Aritmetik ort. Mod Medyan Kartiller GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

22 22 Tanımlayıcı istatistikler Merkezi Eğilim Ölçüleri Aritmetik ort. Mod Medyan Kartiller Dağılım Ölçüleri Range (Değişim Aralığı) Varyans Standart Sapma Değişkenlik(Varyasyon) katsayısı GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

23 23 Tanımlayıcı istatistikler Merkezi Eğilim Ölçüleri Aritmetik ort. Mod Medyan Kartiller Dağılım Ölçüleri Range (Değişim Aralığı) Varyans Standart Sapma Değişkenlik(Varyasyon) katsayısı Çarpıklık ÖlçüleriBasıklık Ölçüleri GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

24 24 Merkezi Eğilim Ölçüleri Veri setinin orta noktası veya merkezinin değeridir. Aritmetik ort. Mod Medyan Kartiller GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

25 25 Aritmetik ortalama: Veri setindeki elemanların toplanıp veri sayısına bölünmesiyle elde edilen yer ölçüsü. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

26 26 Data 1Data 2Data N999 ortalama2,71,92,3 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

27 27 Medyan (Ortanca): Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adı verilir. Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir. Medyan, veri setindeki tüm elemanlardan etkilenmez. Veri Setinin Hacmi Tek Sayı İse; nci gözlem değeri medyandır. Veri Setinin Hacmi Çift Sayı İse; nci gözlem değerinin aritmetik ortalaması medyandır. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

28 28 Data 1Data 2Data ortalama2,71,92,3 medyan222 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

29 29 Mod: Bir veri setinde en çok gözlenen ( en çok tekrar eden ) değere veya frekansı en fazla olan şans değişkeni değerine mod adı verilir. Veri setinin modu olmayacağı gibi birden fazla da modu olabilir. Mod genellikle kesikli şans değişkenleri için oluşturulan gruplanmış verilerde aritmetik ortalama yerine kullanılabilir. Data 1Data 2Data ortalama2,71,92,3 medyan222 mod222 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

30 30 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

31 31 Kartil: Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda dört eşit parçaya ayıran üç değere kartiller adı verilir. İlk % 25’lik kısmı içinde bulunduran 1. Kartil (Q 1 ), % 50’lik kısmı içinde bulunduran 2. Kartil (Q 2 ), % 75’lik kısmı içinde bulunduran 3. Kartil (Q 2 ), olarak adlandırılır. %50’lik kısmı içinde bulunduran 2. Kartil (Q 2 ) aynı zamanda veri setinin medyanıdır. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

32 32 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

33 33 Yayılma (Değişkenlik) Ölçüleri Bir veri setini tanımak yada iki farklı veri setini birbirinden ayırt etmek için her zaman yalnızca merkezi eğilim ölçüleri yeterli olmayabilir. Dağılımları birbirinden ayırt etmede kullanılan ve genellikle aritmetik ortalama etrafındaki değişimi dikkate alarak hesaplanan istatistiklere yayılma (değişkenlik) ölçüleri adı verilir. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

34 34 Yayılma (Değişkenlik) Ölçüleri 34 Aşağıdaki iki grafik n = 1500 hacimli iki farklı örnek doğrultusunda oluşturulan histogramlardır. Her iki örnek ortalaması yaklaşık olarak 100 olduğuna göre iki örneğin aynı anakütleden alındığı söylenebilir mi? GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

35 35 Range (Değişim Aralığı): Veri setindeki yayılımı ifade etmede kullanılan en basit ölçü, değişim aralığıdır. Genel olarak az sayıda veri için kullanılır. En büyük gözlem değeri ile en küçük gözlem değeri arasındaki fark değişim aralığını verir. Range, veri setindeki tek bir gözlemin aşırı derecede küçük veya büyük olmasından etkilendiği için bir başka ifadeyle örnekte yer alan sadece iki veri kullanılarak hesaplanmasından dolayı tüm veri setinin değişkenliğini açıklamak için yetersiz kalmaktadır. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

36 36 Dağılımları birbirinden ayırt etmede kullanılan yayılım ölçüleri aritmetik ortalama etrafındaki değişimleri dikkate alan tanımlayıcı istatistiklerdir. Bir veri setinde aritmetik ortalamalardan her bir gözlemin farkı alınıp bu değerlerin tümü toplandığında sonucun 0 olduğu görülür. Bu örnekten görüleceği üzere gözlemlerin aritmetik ortalamadan uzaklığı alıp toplandığında 0 elde edildiğinden dolayı bu problem mutlak değer kullanarak veya karesel uzaklık alınarak ortadan kaldırılır. Varyans: Veri setindeki her bir gözlem değerinin aritmetik ortalamadan farklarının karelerinin toplamının örnek hacminin bir eksiğine bölünmesinden elde edilen yayılım ölçüsüne örnek varyansı adı verilir. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

37 37 Varyans hesaplanırken kullanılan verilerin kareleri alındığında mevcut ölçü biriminin de karesi alınmış olur. Örnek: ppm^2gibi. Bu nitelendirme veriler açısından bir anlam taşımayacağından varyans yerine ortalama etrafındaki değişimin bir ölçüsü olarak onun pozitif karekökü olan standart sapma kullanılır. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

38 38 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ Station 1Station 2Station 3 Ortalama475 St sapma232 ???? Hangi istasyonda daha sık gözlem yapmalıyım???

39 39 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ Station 1Station 2Station 3 Ortalama475 St sapma232 Değişkrnlik kts 0,50,420,4 ???? Hangi istasyonda daha sık gözlem yapmalıyım???

40 40 Değişkenlik(Varyasyon) Katsayısı: Standart sapmayı ortalamanın bir yüzdesi olarak ifade eden ve iki veya daha fazla veri setinin varyasyonunu (değişkenliğini) karşılaştırmada kullanılan ölçüye varyasyon(değişkenlik) katsayısı denir. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

41 41 Çarpıklık Ölçüleri Veri setlerini birbirinden ayırmak için her zaman yalnızca yer ve yayılım ölçüleri yeterli olmayabilir. Aşağıda iki farklı popülasyondan alınmış örnekler için oluşturulan histogramlar verilmiştir. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

42 42 Simetrik Dağılım A.O = Med = Mod Sağa çarpık dağılım A.O > Med > Mod Sola çarpık dağılım A.O < Med < Mod İki modlu simetrik dağılım Modu olmayan dağılım Tekdüzen dağılım Çarpıklık Ölçüleri GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

43 43 SU KALİTE DEĞERLENDİRME UYGULAMALARINDAN ÖRNEKLER GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

44 Q1:Kutunun alt kenarı Q3:Kutunu üst kenarı Q2:Kutunun ortasındaki çizgi Sapan hariç min.: Alt bıyık Sapan hariç max.: Üst bıyık Sapan değer kontrolu Q1 – 1.5(Q3 – Q1) Q (Q3 – Q1) bu değerleri aykırı (aşan) veriler * ile gösterilir. GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

45 45 Box Plot-Kutu Grafiği GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

46 46 Box Plot-Kutu Grafiği GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

47 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

48 48 “Suppose that a water-quality standard stated that the 90th percentile of arsenic concentrations in drinking water shall not exceed 300 ppb.” “90th percentile!!!!!!! “ Karakteristik değer!!!!!! GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

49 49 Su kalitesi değerlendirmede çok değişkenli istatistiksel yöntemler Faktör analizi Kümeleme (cluster) analizi Diskriminant analizi Çok boyutlu ölçeklendirme (Multi-dimensional scaling) Parametrik olmayan trend analizi Bu konuda yapılmış çalışmalar 2.b.1-liste.docx GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

50 50 GİRİŞ VERİ DEĞERLENDİRME UYGULAMA ÖRNEKLERİ

51 51

52 52 Teşekkür ederim…


"1 SU KALİTESİ VERİLERİNİN İSTATİSTİKSEL YÖNTEMLERLE DEĞERLENDİRİLMESİ Doç. Dr. Hülya Boyacıoğlu Dokuz Eylül Üniversitesi Çevre Mühendisliği Bölümü" indir ppt

Benzer bir sunumlar


Google Reklamları