Çok Örneklem Cucconi Testi ve Bir uygulaması

Slides:



Advertisements
Benzer bir sunumlar
Çıkarımsal İstatistik
Advertisements

Uygun Hipotezin Kurulması, Tip I Hata ve Tip II Hata
Kütle varyansı için hipotez testi
Sosyal Bilimlerde Araştırma Yöntemleri
BENZETİM Prof.Dr.Berna Dengiz 8. Ders.
Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi
İKİ ÖRNEKLEM TESTLERİ.
BAĞIMLI GRUPLARA İLİŞKİN HİPOTEZ TESTLERİ
BAĞIMSIZ GRUPLARDA İKİ ÖRNEKLEM TESTLERİ
TEK YÖNLÜ VARYANS ANALİZİ
THY SPSS UYGULAMASI 1.SORU:Kİ-KARE ANALİZİ
ANOVA.
Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
Prof. Dr. Ali ŞEN Veri Analizi Kış Dönemi
Tıp alanında kullanılan temel istatistiksel kavramlar
PARAMETRİK ANALİZ TEKNİKLERİ
Prof. Dr. Hüseyin BAŞLIGİL
OLASILIK ve OLASILIK DAĞILIMLARI
ÖNEMLİLİK TESTLERİ Dr.A.Tevfik SÜNTER
THY ANALİZLERİ Ki – Kare Testi
Büyük ve Küçük Örneklemlerden Kestirme
SİU 2009 Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler Ethem Alpaydın Boğaziçi Üniversitesi
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
SÜREKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK YOĞUNLUK FONKSİYONLARI
OLASILIK ve KURAMSAL DAĞILIMLAR
İki Ortalama Farkının Test Edilmesi
Hipotez Testi.
THY Uygulaması Araştırması
Önemlilik Testleri Örnekleme yoluyla sağlanan bilgiden hareketle; Kliniklerde hasta hayvanlara uygulanan yeni bir tedavi yönteminin eskisine kıyasla bir.
KRUSKAL WALLIS VARYANS ANALİZİ
İKİ YÖNLÜ MANOVA Birden fazla bağımlı değişkene iki bağımsız değişkenin etki ettiği durumlarda Çift Yönlü MANOVA kullanılır. Çift yönlü MANOVA da başlangıç.
Tüketim Gelir
Yrd. Doç. Dr. Hamit ACEMOĞLU
ÜÇ SINIFLI DURUMLARDA FARKLI SIRALAMALAR İÇİN OLUŞTURULAN ALTERNATİF HİPOTEZLER VE BU HİPOTEZLERE İLİŞKİN TESTLER Elif KAPLAN.
SÜREKLİ ŞANS DEĞİŞKENLERİ
Uygulama I.
HİPOTEZ TESTLERİNE GİRİŞ
Örneklem Dağılışları.
Bilişim Teknolojileri için İşletme İstatistiği
ÖĞRENME AMAÇLARI Veri analizi kavramı ve sağladığı işlevleri hakkında bilgi edinmek Pazarlama araştırmalarında kullanılan istatistiksel analizlerin.
Bilişim Teknolojileri için İşletme İstatistiği
Bilişim Teknolojileri için İşletme İstatistiği
Maliye’de SPSS Uygulamaları Doç. Dr. Aykut Hamit Turan SAÜ İİBF/ Maliye Bölümü.
Örneklem Dağılışları ve Standart Hata
Kİ-KARE TESTİ.
12.HAFTA İÇERİK VARYANS ANALİZİ Giriş Tek Faktörlü Varyans Analizi
Güven Aralığı.
Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ B.
HİPOTEZ TESTLERİNE GİRİŞ
ÖĞRENME AMAÇLARI Pazar segmentasyon kararları için farkların nasıl kullanıldığını öğrenmek t testinin ve z testinin ne zaman kullanılması gerektiği.
İSTATİSTİKTE TAHMİN ve HİPOTEZ TESTLERİ İSTATİSTİK
Çıkarsamalı İstatistik Yöntemler
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
Örnek: Kalple ilgili bir çalışmada 25 yaşındaki 24 erkek ve 40 yaşındaki 30 erkeğin sistolik kan basınçları ölçülmüştür. Elde edilen verilere göre 0.05.
NON-PARAMETRİK TESTLER Doç. Dr. Kemal DOYMUŞ K.K.E.F İlköğretim Bölümü.
Numerik Veri İki Bağımsız Grup
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
ANLAM ÇIKARTICI (KESTİRİMSEL) İSTATİSTİK
Numerik Veri Tek Grup Prof. Dr. Hamit ACEMOĞLU.
HİPOTEZ TESTLERİ.
Tıp Fakültesi UYGULAMA 2
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
İSTATİSTİK II Hipotez Testleri 1.
DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
2.Hafta Dağılım İç tutarlılık Tek Örneklem t Testi
Sunum transkripti:

Çok Örneklem Cucconi Testi ve Bir uygulaması Mutlu Umaroğlu UBK 16 – Antalya Çolaklı 10-12 Eylül 2014

Giriş Grup karşılaştırması yapan testler en önemli istatistiksel yöntemlerden biridir. Bu testler sadece konum parametresini test eder. Ölçek parametresini karşılaştıran çeşitli testler de vardır. Çoğu çalışmada konum parametresi test edilmesine rağmen bazı tür çalışmalarda hem konum hem de ölçek parametrelerinin test edilmesine gerek duyulur.

Giriş Biyomedikal, biyoinformatik, iklim dinamikleri, finans gibi alanlardaki bazı çalışmalarda konum ve ölçek parametresinin değişimi birlikte incelenmelidir. Tıpta tedavi sürerken ortalama ve değişkenliğin her ikisinin birden değişmesi önemli rol oynayabilir. Örneğin diyabet tedavisinde glikoz düzeyinin hem ortalama hem de değişkenlik açısından farklılaşması önemli olabilir.

Giriş Bu tür durumlarla ilgili ilk kez Tukey 1959’da yeni bir yöntem üzerine çalışmıştır. Ancak bu yöntemde güçten kayıp söz konusudur. Konum ve ölçek parametresini eşanlı olarak inceleyen testler: Cucconi(1968), Lepage(1971), Podgor-Gastwirth(1994), Neuhäuser(2000), Zhang(2006) ve Murakami(2007).

Lepage Testi Konum ve ölçek parametresinin değişimini eş anlı olarak inceleyen testler içinde en bilinenidir. İki örneklem konum-ölçek testi olarak konum parametresini inceleyen Wilcoxon testi ve ölçek parametresini inceleyen Ansari-Bradley testinin kombinasyonundan oluşur.

Lepage Testi n çift n tek W: AB: E: V: Wilcoxon test istatistiği Ansari-Bradley test istatistiği Beklenen değer Varyans n tek

Cucconi Testi Eş anlı olarak konum ve ölçek parametresini test eder. İlk kez 1968 yılında önerilmiştir ancak Cucconi testi İtalyan yerel yayınında yayımlandığı için az bilinmektedir. 2009’dan bu yana Marozzi bu yöntem üzerine çalışmaktadır.

Cucconi Testi Marozzi, Cucconi testi üzerine çalışmış ve ilk defa exact kritik değerler tablosunu oluşturmuştur (Cucconi asimptotik kritik değerler tablosu). Tip I hata olasılığı ve güç üzerine de çalışmıştır. Çok örneklem Cucconi testini oluşturmuştur.

Cucconi Testi Cucconi testi ile ilgilenilmeye başlanmasının temel nedenleri: Lepage testinden önce yayınlanması Konum testlerinin ve ölçek testlerinin birleştirilmesinden oluşturulmaması Lepage testi ile karşılaştırıldığında güç ve test istatistiğinin analitik olarak hesaplamasında sorun çıkmaması Test istatistiğini hesaplamanın diğer yöntemlere göre daha kolay olması

Cucconi Testi Test Hipotezi: Cucconi test istatistiği

Cucconi asimptotik kritik değerler tablosu

Çok Örneklem Lepage Testi İkiden fazla grup için konum ve ölçek parametresinin eşanlı değişimini inceleyen testler içinde en bilinenidir. Wilcoxon ve Ansari-Bradley testinin birleşiminden oluşur. Benzer amaçla geliştirilmiş Murakami MH1 ve MH2 testi de vardır. Bu testler de Lepage tipi testlerdir.

Çok Örneklem Lepage Testi Test istatistiği:

Çok Örneklem Cucconi Testi Cucconi testi iki grup için eşanlı olarak konum ve ölçek parametresini test etmektedir. Marozzi, Cucconi testi üzerinde çalışmış ve bu testi ikiden çok grup için genelleyen yeni bir yöntem geliştirmiştir. 2013’de geliştirilen bu yönteme göre ikiden çok grup için eşanlı olarak konum ve ölçek parametresini test etmek mümkündür.

Çok Örneklem Cucconi Testi Test Hipotezi: Test istatistiği: Test Hipotezi: Test istatistiği:

Çok Örneklem Cucconi Testi Test istatistiği:

Çok örnek Cucconi Testi µ1>µ2 ve σ1=σ2 olduğunda daha büyük olma eğilimindedir. Böylece U1 0’dan büyük olma V1 0’dan küçük olma eğilimindedir. µ1<µ2 olduğunda tam tersi doğrudur. µ1=µ2 ve σ1>σ2 olduğunda daha büyük olma eğilimindedir. Böylece U1 0’dan büyük olma eğilimindedir.

Çok Örneklem Cucconi Testi Çok örneklem Cucconi Testi bir permutasyon testidir ve P değeri permutasyon üzeriden hesaplanır. Permütasyon sayısı MC test istatistiğini etkilenmez sadece P değeri üzerinde etkilidir. Permutasyon testini uygularken çok örneklem Cucconi test istatistiğinin asimptotik dağılımı önemli değildir.

Çok Örneklem Cucconi Testi Gözlenen verilerden MC istatistiği hesaplanır ve MC0 olarak atanır Örneklemler birleştirilir (X=(X1,X2,…,Xk)) ve birleştirilmiş örneklemden rasgele olarak örnek seçilerek MC istatistiği hesaplanır ve MC1 olarak atanır 2. adım B kez tekrarlanır (MC2, MC3,…,MCB) Kestirilen P değeri α’dan küçük veya eşitse H0 hipotezini reddedilir

Örnek 54 yiyecek firmasının sattığı bir et ürünündeki sodyum değerleri miligram cinsinden aşağıda verilmiştir. Bu ürün içerdiği et türüne göre (kırmızı et, beyaz et ve domuz eti) sınıflandırılmıştır. Bu sınıflar arasında konum-ölçek parametresi bakımından anlamlı bir farklılık var mıdır?

Örnek Kırmızı et 253 298 300 317 319 322 330 370 375 386 401 425 440 477 479 482 495 587 645 Domuz eti 144 339 360 372 387 393 405 428 458 473 496 506 507 511 545 Beyaz et 357 358 359 383 396 426 430 513 522 528 542 581 588

Örnek Ortalama %95 Güven Aralığı Ortanca Varyans Std. Sapma ÇAG   Ortalama %95 Güven Aralığı Ortanca Varyans Std. Sapma ÇAG En Küçük En Büyük Alt Sınır Üst Sınır Kırmızı Et 401,15 353,21 449,09 380,5 10492,87 102,44 158,75 253 645 Domuz Eti 418,53 370,26 466,79 405 8812,02 93,87 122 144 545 Beyaz Et 459 415,43 502,57 430 7180,75 84,74 156 357 588 Permütasyon Sayısı  Cucconi P 1 2,080299 10 0,1 100 0,09 1000 0,073 10000 0,0757 100000 0,07458 1000000 0,07494

Tartışma - Sonuç Geleneksel yöntemlerde konum-ölçek probleminin çözümünde konum testi ve ölçek testinin birleşiminden yararlanılır. MC testinde test istatistiği sadece ranklar üzerinden hesaplanır. Yokluk hipotezi doğru ise test istatistiğinin 0’a yakın olması beklenir. Eğer en az iki dağılım fonksiyonu farklı konum-ölçek parametresine sahip ise test istatistiği 0’dan farklıdır. Dağılımların farkı arttıkça test istatistiği büyür.

Tartışma - Sonuç MC test istatistiği yeniden örnekleme temelli yöntemler kullanılarak analitik olarak hesaplanabilir. Hesaplamalarda kullanılan iki önemli etken Tip I hata ve güçtür. MC testi asimptotik dağılımlardan bağımsız herhangi bir veri setine uygulanabilir. MC istatistiği Uk ve Vk arasındaki Mahalanobis uzaklığının yarısının ortalamasına eşittir.

Kaynaklar Marozzi M., The Multisample Cucconi Test, Statistical Methods & Applications, Wiley, 2014 Bonnini S., Corain L., Marozzi M., Salmaso L., Nonparametric Hypothesis Testing: Rank and Permutation Methods with Applications in R ISBN: 978-1-119-95237-4, Wiley, 2014 Marozzi M., Some Notes on the Location-Scale Cucconi Test, Journal of Nonparametric Statistics, 2009 Marozzi M., Nonparametric Simultaneous Tests for Location and Scale Testing: A comparison of Several Methods, 2013 Marozzi M., A Modified Cucconi Test for Location and Scale Change Alternatives, 2013 Lepage Y., A combination of Wilcoxon's and Ansari-Bradley's statistics, Biometrika, 1971 Rublik F., The multisample version of The Lepage Test, Kybeynetika,2005 Neuhauser M. Leuchs A., Ball D., A new Location-Scale test based on a combination of the ideas of Levene and Lepage, Biometrical Journal, 2011

R Kodları MultiSampleCucconiTest <- function(pooled.sample, sample.sizes, B){ # Outer function: Inner fonksiyon yardimiyla permutasyona dayali test istatistiğini hesaplar # Argumanlar: # pooled.sample: birlestirilmis orneklem # sample.sizes: orneklem genisligi vektoru # B: permutasyon sayisi # Ciktilar: # mc.test[1]: MC test istatistigi # mc.test[2]: MC testinin p degeri MultiSampleCucconiStat <- function(pooled.sample, sample.sizes){ # Inner function: MC test istatistiğini hesaplar # MC test istatistigi sample.sizes <- c(0, sample.sizes) n <- sum(sample.sizes) K <- length(sample.sizes) ranks <- rank(pooled.sample) contrary.ranks <- n+1-ranks groups.ranks <- vector("list", K-1) groups.contrary.ranks <- vector("list", K-1) cum.sample.sizes <- cumsum(sample.sizes) for (k in 1:(K-1)){ groups.ranks[[k]] <- ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])] groups.contrary.ranks[[k]] <- contrary.ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])] } sample.sizes <- sample.sizes[2:length(sample.sizes)] means <- vector(, K-1) st.dev <- vector(, K-1) for (k in 1:(K-1)){ means[k] <- sample.sizes[k]*(n+1)*(2*n+1)/6 st.dev[k] <- (sample.sizes[k]*(n-sample.sizes[k])*(n+1)*(2*n+1)*(8*n+11)/180)^0.5 } covariance <- -(30*n+14*n^2+19)/(8*n+11)/(2*n+1) u.stat <- vector(, K-1) v.stat <- vector(, K-1) partial.c.stat <- vector(, K-1) u.stat[k] <- (sum(as.vector(groups.ranks[[k]])^2)-means[k])/st.dev[k] v.stat[k] <- (sum(as.vector(groups.contrary.ranks[[k]])^2)-means[k])/st.dev[k] partial.c.stat[k] <- (u.stat[k]^2+v.stat[k]^2-2*u.stat[k]*v.stat[k]*covariance) /2/(1-covariance^2) c.stat <- mean(partial.c.stat) return(c.stat) # inner fonksiyon sonu mc.test <- vector(, 2) permutation.cucconi.stat <- vector(, B) for (b in 1:B){ pooled.sample.perm <- sample(pooled.sample) permutation.cucconi.stat[b] <- MultiSampleCucconiStat(pooled.sample.perm,sample.sizes) mc.test[1] <- MultiSampleCucconiStat(pooled.sample, sample.sizes) mc.test[2] <- length(permutation.cucconi.stat[permutation.cucconi.stat >= mc.test[1]])/B return(mc.test)

Teşekkürler mutlu.umaroglu@hacettepe.edu.tr