Bilişim Teknolojileri için İşletme İstatistiği Nitel Veri Analizi B Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ
NİTEL VERİ ANALİZİ En önemli nitel veri analizi testi Ki-Kare testidir.
Kİ-KARE BAĞIMSIZLIK TESTLERİ Ki-Kare bağımsızlık testleri iki farklı nitel değişkenin arasındaki farklılığın istatistiksel açıdan anlamlı olup olmadığının incelendiği hipotez testleridir. Bu hipotez testleri verilerin kontenjans tablosu şeklinde gösterilmesi ile başlar, daha sonra eşitlik ve farklılık (sıfır ve alternatif) hipotezleri kurulur ve test istatistiği hesaplanıp, kabul olasılığı incelenir.
Kİ-KARE BAĞIMSIZLIK TESTLERİ Bir mağaza gün içerisinde alış veriş gerçekleştiren kadın ve erkek müşterilerin harcama düzeylerinin farklı olduklarını düşünmektedir. Bu bağlamda aşağıdaki kontenjans tablosunu hazırlamıştır. Yukarıdaki tabloyu dikkate alarak müşteri cinsiyeti ile harcama düzeyler arasındaki ilişkiyi sorgulayınız.
Kİ-KARE BAĞIMSIZLIK TESTLERİ Gözlenen Frekanslar Beklenen Frekanslar Kabul olasılığı 0,04576 çıkmıştır. Yani iki veri seti (Kadın ve Erkek) farklı sonuç üretmiştir. Bu durumda iki grup harcama düzeyi açısından farklılık göstermektedir. Yani cinsiyet ve harcama düzeyi birbiri ile ilişkilidir.
Kİ-KARE HOMOJENLİK TESTLERİ Homojenlik testleri bağımsızlık testinin farlı bir bakış açısı ile değerlendirilmesidir. Bağımsızlık testlerinde iki farlı bölümlemenin aynı olup olmadığına, yani bölümlerin bağımsızlığına odaklanır. (Kadın – Erkek ayrımı istatistiksel açıdan uygun mu) Homojenlik testi ise direkt olarak farklı zamanlarda çekilen iki örneğin aynı ana kütleye ait olup olmadıklarının sorgulanmasıdır. (Örneklem 1 ile Örneklem 2 Kadın ve Erkek oranları dikkate alındığında aynı ana kütleden çekilmiş olabilir mi)
Kİ-KARE HOMOJENLİK TESTLERİ Bir alış veriş merkezi hafta içi gelen ziyaretçilerin akıllı telefon sayıları ile hafta sonu gelen ziyaretçilerin akıllı telefon sayılarını inceleyerek, farklı profil gösterip göstermediklerini incelemek istemektedir. Bu farklılığı istatistiksel açıdan aşağıda verilen frekansları dikkate alarak sorgulayınız.
Kİ-KARE HOMOJENLİK TESTLERİ Gözlenen frekanslardan beklenen frekanslar aşağıdaki gibi hesaplanmıştır. Kabul olasılığı 0,38735 çıkmıştır. Yani bu iki örneklemin aynı ana kütleden geldiğini öngören sıfır hipotezi kabul edilmiştir. Yani hafta içi müşterisi ile hafta sonu müşterisi profilleri farklılık göstermemektedir.
Kİ-KARE UYUMLULUK TESTLERİ Uyumluluk testleri ise ana kütle dağılımı ile örneklem dağılımının benzeşmesinin istatistiksel açıdan uygunluğunun testi şeklindedir. Burada amaç ana kütle dağılımı ile örneklem dağılımının örtüştürülmesidir. Ana kütle dağılımı kesikli olarak verilebileceği gibi, herhangi bir dağılıma uygunluğu da özellikle belirtilebilir. (Normal dağılıma uygun gibi)
Kİ-KARE UYUMLULUK TESTLERİ Bir firma web sitesini ziyaret eden kişilerin ortalama 50 saniye, 10 saniye standart sapma ile ziyaretlerini gerçekleştirdiklerini düşünmektedir. Bu durumu ispatlamak adına rastgele bir saatte ziyaretçilerin sitede kalma sürelerini dikkate alarak aşağıdaki frekans tablosunu oluşturmuştur. Acaba firma sahipleri haklı mıdır?
Kİ-KARE UYUMLULUK TESTLERİ Kabul olasılığı değeri incelendiğinde veri setinin, ,incelenen dağılım ile aynı şekilde dağıldığını öngören sıfır hipotezi kabul edilmiştir. Yani veriler normal dağılmıştır.
AMAN DİKKAT Bağımsızlık testleri ile homojenlik testlerinin kullanım yerlerini karıştırmayın. Farklı kullanım farklı yorum sonucunu doğurur. (Her ne kadar aynı şekilde bulunuyor olsalar bile) Uygunluk testlerinde illa ki bilinen bir olasılık dağılımına uygunluğun araştırılması gerekmez. Eğer ana kütlenin dağılımını kesikli bir olasılık dağılımı ile yazabiliyorsak, bu dağılıma uygunluğu da test edebiliriz.