İSTATİSTİKSEL VERİ ANALİZİNE GİRİŞ DOÇ.DR. NİHAL SÜTÜTEMİZ
Ölçme Önceden belirlenen bir kurala/kritere göre nesnelerin ve kişilerin özelliklerine sayılar veya semboller atamaktır.
Ölçme düzeylerİ Ölçme Düzeyi Mukayese Kriteri Örnekler Nominal/Sözde Kimlik Cinsiyet, Göz rengi, Plakalar Sporcu forma numaraları Takım taraftarlığı Ordinal/sıralı Sıra Sıralama Marka tercihi Sosyal sınıf Lig sıralaması Interval/Aralık Aralıklar Sıcaklık ölçeği Başarı puanı Bir ürüne karşı tutumlar Ratio/Oransal Mutlak büyüklük Satış miktarı Ağırlık Zaman
NOMİNAL SEVİYELİ ÖLÇEKLER
NOMİNAL (İSİMLİ/SÖZDE) ÖLÇEK …. Nominal ölçek nitel olarak adlandırılan veriler için kullanılır. Gözlenen birimleri kategorilere, sınıflara veya tiplere ayıran sınıflandırma ölçüsüdür. örn; cinsiyet, tatil yöreleri, turistlerin milliyetleri vb.
İsim ölçeğiyle matematiksel işlem yapılamaz NOMİNAL ÖLÇEK … Nominal ölçekte numaralar isim yerine kullanılır. Numaranın aritmetik büyüklüğü ve küçüklüğü hiç bir anlam ifade etmez. İsim ölçeğiyle matematiksel işlem yapılamaz
Nominal verilerle parametrik analizler yapılamaz. NOMİNAL ÖLÇEK … Bu ölçüm düzeyi ile elde edilen verilerin bize sunduğu yorum, yüzdelerle azlık ve çokluk ötesine gidemez. Nominal verilerle parametrik analizler yapılamaz.
SIRALAMA SEVİYELİ ÖLÇEKLER
SIRALAMALI/KADEMELİ (ORDİNAL) ÖLÇEKLER … Bu ölçü bir değişkenin özelliklerinin göreceli durumu veya yoğunluğu üzerinde durur. Bu durum, değişkenin özellikleriyle ilgili verileri bir sıralama olasılığı verir. Verilen değerler kademeli bir şekilde azdan çoğa, iyiden kötüye, kısadan uzuna doğru sıralanabilir.
SIRALAMALI (ORDİNAL) ÖLÇEKLER … Bu sıralama belli ölçüde karşılaştırma olanağı verir. Fakat atanan değerler arasında anlamlandırılabilecek”mesafe/aralık yoktur. Ölçüde anlam sadece kademeleşme sırasında vardır.Fakat derecelendirmede 1 ile 2 ve 3 ile 4 arasındaki nitelik farkı anlamlandırılamaz.
SIRALAMALI (ORDİNAL) ÖLÇEKLER … ÖRNEĞİN; (İKİ KUTUPLU TUTUM) 1= NEFRET EDERİM 2= SEVMEM 3= NE SEVERİM NE DE SEVMEM 4= SEVERİM 5= DELİCESİNE SEVERİM
SIRALAMALI (ORDİNAL) ÖLÇEKLER … (TEK KUTUPLU TUTUM ÖLÇEĞİ) 1= TAPIYORUM 2= DELİCESİNE SEVİYORUM 3= ÇOK SEVİYORUM 4= SEVİYORUM 5= AZ SEVİYORUM
SIRALAMALI (ORDİNAL) ÖLÇEKLER … Bu ölçmede parametrik analizler yapılamaz. Kademeli verilerle frekans dağılımı ve kademeli sıralama (rank order) istatistikleri yapılır. Sosyal bilimlerde en yaygın kullanılan ölçek tipi likert dir.
ARALIK SEVİYELİ ÖLÇEKLER
ARALIK (INTERVAL) ÖLÇEKLER Aralıklı ölçümde, numaralar özelliğin kendi içinden gelir ve numaralar arasındaki mesafe eşittir. Aralıklı ölçek seviyeye çıktığımızda, ölçüler arasındaki mesafenin bir anlamı vardır. Mesafe yorumlanabilir ve karşılaştırma yapılabilir.
ARALIK (INTERVAL) ÖLÇEKLER Örneğin; 15 derece ile 20 derece arasında 5 derece fark vardır ve bu fark 40 derece ile 45 derece arasındaki beş derecelik fark gibidir.
ARALIK (INTERVAL) ÖLÇEKLER Fakat oran almak ve karşılaştırmak anlam taşımaz çünkü böyle bir karşılaştırma için ölçeğin keyfi değil mutlak sıfır değere (özelliğin yokluğuna) sahip olması gerekir. Örn;40 derece sıcaklık 20 derecenin iki mislidir fakat iki misli sıcaklık değildir.
RASYO SEVİYESİ ÖLÇEKLER
ORANLI (RATIO) ÖLÇEKLER Oranlı ölçek mesafeli ölçektir, fakat farkı mutlak sıfır noktası olmasıdır. Bir ölçeği oranlı ölçek yapan, ölçeğin sıfır değerine sahip olmasıdır. Örneğin; boy, ağırlık ve kalori ölçülerinde değer olmayan başlangıç “sıfır” noktası vardır.
ORANLI (RATIO) ÖLÇEKLER Örneğin; 30 kiloluk bir kişi ile 60 kiloluk bir kişi arasındaki 30 kilo fark, fark olarak 30 kilodur ve 60 otuzun iki mislidir.
ÖLÇEK TÜRLERİ Ölçekler Sürekli Tekli Çoklu Kategorili ölçekler Sıralama ölçekleri Sabit-toplam ölçekleri Likert ölçeği Semantik farklar ölçeği Grafiksel ölçekler Stapel ölçeği İkili karşılaştırma ölçekleri
Sürekli Ölçekler (Örnekler) Diğer marketlerle karşılaştırdığınızda MİGROS mağazasını nasıl buluyorsunuz? Format 1 Muhtemelen en kötüsü ..........X................................... Muhtemelen en iyisi Format 2 0 50 100 Format 3 Çok kötü Ne kötü/ne iyi Çok iyi Muhtemelen .....................X............................................................ Muhtemelen En kötüsü 0 10 20 30 40 50 60 70 80 90 100 en iyisi
Tekli Ölçekler- Kategorili Ölçek Aldığınız nottan ne derece memnunsunuz? [...] Çok memnun [...] Oldukça memnun [...] Kısmen memnun [...] Pek memnun değil [...] Hiç memnun değil Bu markayı seçmekten memnunsunuz? Çok memnun 1.........2.........3.........4.........5 Hiç memnun değil Bölgenizde bulunan hastanelere kıyasla SDH’ni nasıl buluyorsunuz? [...] Çok iyi [...] Vasat/Orta [...] Çok kötü
Tekli Ölçekler-Sıralama ölçeği Çamaşır makinesi satın alırken, tercihinizin belirlenmesinde aşağıdaki faktörlerin rolünü önem sırasına göre belirtiniz? (1,2,3,.. Şeklinde sıralayınız) Özellikler Önem sırası Kalitesi ----------- Fiyatı ----------- Satış sonrası hizmetleri ----------- Ödeme kolaylığı ----------- Markası -----------
Tekli Ölçekler-Sabit Toplam Ölçeği Bir çamaşır makinesi seçerken göz önüne aldığınız aşağıdaki beş özellik arasında size verilen 100 puanı önem derecesine göre bölüştürünüz. Kalitesi -------- Sessiz çalışması -------- Satış sonrası hizmetler -------- Ekonomisi -------- Yedek parça imkanı -------- TOPLAM 100
Tekli Ölçekler-Grafiksel/Şekilsel İşletmemizden aldığınız hizmetlerden ne derece memnunsunuz ?
Tekli Ölçekler- İkili karşılaştırma Bir ürün satın alırken aşağıdaki özelliklerden hangisi daha önemlidir? [...] Kalite - Fiyatı [...] Fiyatı - Satış sonrası hizmetler [...] Yedek parça - Dayanıklılık .....................
Çoklu Ölçekler- Likert Ölçeği “Bu oteli seçmekle son derece isabetli bir karar vermişim” ifadesine ne derecede katılıyorsunuz? [...] Hiç katılmıyorum [...] Kısmen katılmıyorum [...] Ne katılıyorum ne de katılmıyorum [...] Kısmen katılıyorum [...] Tamamen katılıyorum
Çoklu Ölçekler- Semantik Farklar Sizce MİGROS, Ucuz !.........!..........!....X...!..........!...........!...........!..........! Pahalı Az çeşit !.........!..........!..........!.........!.....X....!...........!..........! Bol çeşit Geleneksel !.........!.....X..!..........!.........!............!...........!..........! Modern
Ölçeklerle İlgili Bazı Konular Kategori sayısı Ölçeklerde denge Tek-Çift sayıda kategori Zorlamalı veya zorlamasız ölçek Kategori yapısı ve yazılı gösterimi Ölçeğin fiziksel formu
VERİLERDE İNANDRICILIK Geçerlilik Bir test veya ölçeğin ölçülmek istene şeyi ölçme derecesidir. İçerik geçerliliği: Ölçme aracının yeterli sayıda ve ölçülmek istenen olguyu ölçebilecek içerikte soruları içermesinin bir göstergesi. Yapısal geçerlilik: Ölçeğin hangi kavram veya özellikleri ölçtüğünün belirlenmesinin incelenmesi. Yakınsak geçerlilik: Aynı yapıyı ölçen diğer ölçeklerle kıyaslandığında ne derece bir örtüşme söz konsudur. Ayırt edici geçerlilik: Bir yapıyı ölçen ölçeklerle başka yapıları ölçen ölçekler arasında farklılığın olduğunun belirlenmesi. Güvenilirlik Bir ölçek veya testin ölçmek istediği şeyi istikrarlı ve tutarlı bir şekilde ölçme derecesidir. İçsel tutarlılık ölçümü (Cronbach Alfa) Test-yeniden test yöntemi Alternatif formların kullanımı
Analiz Tekniklerinin Sınıflandırılması DEĞİŞKEN SAYISINA GÖRE Tek değişkenli Çok değişkenli VERİ ÖZELLİKLERİNE GÖRE Parametrik teknikleri Parametrik olmayan teknikler AMAÇLARA GÖRE Farklılıkları inceleyen teknikler İlişkileri inceleyen teknikler
Parametrik Analiz Tekniklerinin Önşartları (a) Normal dağılım (b) Pozitif çarpıklık (c) Negatif çarpıklık Parametrik analiz tekniklerinin uygulanabilme önşartları, Ölçüm seviyesinin en az aralık seviyesinde olması, Verinin normal dağılım sergilemesi, Hedef kitlede yer alan bütün grupların aynı varyans değerine sahip olması Hata değerlerinin tesadüfi (random) olması,
Uygun Analizi Tekniği Seçiminde Etkili Faktörler Verinin özellikleri – ölçüm seviyesi Veri özellikleri – veri dağılımı Araştırma dizaynı – amaç Gözlem sayısı Analiz sonuçlarının önemi Merkez Limit Teoreminin asgari 30 gözlem şartı Analiz yöntemi Çok değişkenli analizlerde değişken sayısının 10-20 katı gözlem arzu edilir
Veri Özelliği ve Araştırma Amacına Göre Uygun Analizler
TOPLAM HATA = ÖRNEKLEME HATASI + ÖRNEKLEME DIŞI HATALAR Araştırmalarda HATA TOPLAM HATA = ÖRNEKLEME HATASI + ÖRNEKLEME DIŞI HATALAR
Araştırmalarda Potansiyel Hata Kaynakları Toplam Hata Örnekleme Dışı (Sistematik) Hata Tesadüfi (Rassal) Örnekleme Hatası Cevaplamama Hatası Cevaplama Hatası Anketör Hataları Cevaplayıcı Hataları Araştırmacı Hataları Yanlış Bilgi Hatası Ölçüm hatası Anakütle Belirleme Hatası Örnekleme Çerçevesi Hatası Veri Analizi Hatası Cevaplayıcı Seçim Hatası Soru Sorma Hatası Kayıt Hatası Aldatma Hatası Yetersizlik Hatası İsteksizlik Hatası
Tesadüfi (Rassal) Örnekleme Hatası İstatistik Değeri Örnekleme Hatası Parametre Değeri Anakütlenin elde edilmeye çalışılan gerçek parametre değeriyle, seçilen örneklemden elde edilen istatistik değeri arasındaki farktır. Örnek: Sakarya ilinde aylık ortalama tüketim harcamalarının ortalamasının tahmin edilmesi istendiğinde, Sakarya’daki ailelerin aylık ortalama elektrik tüketimi ile seçilen 300 ailelik bir örneklemin aylık ortalama elektrik tüketimi arasındaki fark - =
Tesadüfi (Rassal) Örnekleme Hatası Seçilen örneklemin anakütleyi tam olarak temsil edemediği durumlarda ortaya çıkar. Tesadüfi örnekleme hatası defalarca seçilecek değişik örneklemler arasındaki farklılığı temsil eder. Örneğin: Dört adet satış elemanının projeksiyon makinası satan bir firmada çalışmaktadır. Herbir satış elemanının Ocak ayında yaptığı satışlar aşağıdaki tabloda yer almaktadır.
Örneklem Ortalamalarının Ortalaması Satış Elemanı Ocak Ayı Satış Miktarı Ahmet 3 Mehmet 1 Murat 2 Sinan 5 Ortalama Satış 2,75 Satış Elemanı Ocak Ayı Satış Miktarı Örneklem Ortalaması Ahmet, Mehmet 3,1 2 Ahmet, Murat 3,2 2,5 Ahmet, Sinan 3,5 4 Mehmet, Murat 1,2 1,5 Mehmet, Sinan 3 Murat, Sinan Örneklem Ortalamalarının Ortalaması 2,75
Örnekleme Dağılımı
Örnekleme Dağılımı µX SX ¾ C
Tablo 1: Farazi Anakütle için Dışarıda Yemek Harcamaları 500 10 450 9 400 8 350 7 300 6 250 5 200 4 150 3 100 2 50 1 Yıllık Dışarıda Yemek Harcaması ($) Aile Numarası
Table 2: Olası Örneklemlerin Kısmi Listesi ve Örneklem Ortalamaları 475 9,10 375 5,10;6,9;7,8 275 1,10;2,9;3,8;4,7;5,6 175 1,6;2,5;3,4 75 1,2 Örneklem Ortalaması Değeri ($) Ailelerin İkili Örneklemleri
İki Hacimlik Tesadüfi Örneklemler İçin Örnekleme Dağılımı-Sütun Diyagramı
Histogram ile Örnekleme Dağılımının Gösterimi
Tesadüfi olmayan örnekleme, yani, araştırmacının örneklemi kendi kişisel kararıyla seçmesi durumunda, Örnekleme hatasını hesaplayabilme şansı ortadan kalkar. Çünkü tesadüfi örneklemede, anakütleyi oluşturan her bir elemanın örneklem içinde yer alma şansı bellidir, ancak tesadüfi olmayan örneklemede belli değildir.
Örnekleme Dışı Hatalar (Sistematik Hatalar) Örnekleme dışındaki tüm hata kaynakları olabilir. Tesadüfi olabileceği gibi tesadüfi olmayabilir de (sistematik). Bunlar çeşitli sebeplere yanabilir: Cevaplamama Hatası Üç boyutta ortaya çıkabilir: Cevaplayıcının araştırmaya katılmayı reddetmesi Cevaplayıcının mülakatın ortasında cevap vermeyi bırakması Cevaplayıcının belirli bir soruyu cevaplamayı reddetmesi, ancak diğer sorulara cevap vermesi
İnsanları Soruları cevaplamamaya iten bazı nedenler vardır: Hastalık, dil problemi, cevapların bilinmemesi, cezalandırılma korkusu, zaman darlığı veya diğer isteksizlik nedenleri Taşınma, tatil, iş seyahati vb. Nedenlerle anketör geldiğinde potansiyel cevaplayıcılar evde veya anketi cevaplamaları beklenen yerde olmayabilirler
Cevaplama Hatası Cevaplama hataları araştırmacıdan, anketörden veya cevaplayıcıdan kaynaklanabilir.
Araştırmacı Tarafından Yapılan Hatalar Yanlış Bilgi Hatası Pazarlama araştırmacısının aslında ihtiyaç duyduğu bilgiyle aradığı bilginin farklı olması durumunda ortaya çıkar. Örnek: Marka tercihini değerlendirmek isteyen bir araştırmacı sadece fiyatı dikkate alırsa, marka tercihini etkileyen diğer faktörleri göz ardı etmiş olur.
Araştırmacı Tarafından Yapılan Hatalar Ölçüm Hatası Araştırmacının gerçekten ölçmek istediği şeyi, ölçememesi durumunda ortaya çıkar. Ölçüm hatası ölçüm sürecinin kendisi tarafından oluşturulan ve üretilen bilgi ile araştırmacı tarafından aranan bilgi arasındaki farkı temsil eder. Örnek: Kişisel Gelir düzeyine ilişkin bir sorunun, Geliriniz?.............. Şeklinde sorulması hata içerir. Çünkü araştırmacının ölçmeye çalıştığı cevaplayıcının kişisel geliridir. Ancak verilecek cevap, aile geliri, aylık gelir, yıllık gelir, servet vb. şekilde anlaşılarak verilebilir.
Bir anket formunda doğru soruların sorulması kadar, soruların doğru sorulması da önemlidir.
Ölçüm Hatası Sorularda belirsizlikten ve bilinçli yada bilinçsiz koşullandırmalardan kaçınılmalı, mümkün olduğunca tarafsız ifadelere yer verilmelidir. Okulu ne zaman terk ettiniz? Ekonomi çok kötüye gidiyor, siz ne düşünüyorsunuz? Yaş, gelir gibi kişisel sorular doğrudan sorulmak yerine gruplandırılarak sorulmalıdır. 1-25 26-35 46-55 56 ve üzeri
Ölçüm Hatası Cevaplayana göre değişebilecek ifadelerden kaçınılmaya çalışılmalıdır. Genellikle sinemaya gider misiniz? Gerçekdışı varsayımlara dayanan sorular sorulmamalıdır. Operanın arabesk müzike üstünlükleri nelerdir? Çocuklarınız hangi okula gidiyor? Bir soru içinde birden fazla soru sorulmamalıdır. LG marka televizyonlar ucuz ve fonksiyonel midir? Bankanın müşteri hizmetlerinden ve işlemlerinin hızından ne derece memnunsunuz?
Ölçüm Hatası Sorulara ilişkin şıkların anlaşılır ve basit olması gerekir. Hangi sıklıkla internete girersiniz? Sık sık Bazen Ara sıra Nadiren Hiç Cevaplayıcının hatırlamayacağı detayları sormaktan kaçınılmalıdır. İnsan kaynakları departmanına ne zaman atandınız? Bu yıl kaç defa tiyatroya gittiniz?
Araştırmacı Tarafından Yapılan Hatalar Anakütle Tanımlama Hatası Araştırmacı uygun olmayan anakütleyi seçtiğinde bu tür hata oluşur Örnek: Paketlenmiş ürünlerin satın alınmasında önemli olan faktörleri ortaya çıkarmaya ilişkin yapılan bir araştırmada, anakütlenin kadınlar olarak belirlenmesi hata içerir. Çünkü erkekler de ambalajlı ürünlerin önemli bir kısmını satın alır ve satın alma üzerinde doğrudan ve dolaylı önemli bir etkiye sahip olabilir. Bu nedenle, anakütleyi tanımlarken erkekler hariç tutulursa, yanlış anakütle hedeflenmiş olur ve araştırma yanlış sonuçlar verir.
Araştırmacı Tarafından Yapılan Hatalar Örnekleme Çerçevesi Hatası Hedeflenen anakütle doğru olduğu halde, çerçeve yanlış belirlendiyse, seçilen örneklem anakütleyi iyi temsil etmez. Örnek: Sakarya ilinde yaşayanların yerel seçimlerde hangi partilere oy verecekleri konusunda yapılan bir araştırmada, örnekleme çerçevesi olarak telefon rehberinin belirlenmesi hata içerir. Çünkü, Sakarya ilinde yaşamakta olan, ancak telefon rehberine kayıtlı olmayan çok sayıda insan vardır.
Araştırmacı Tarafından Yapılan Hatalar Veri Analizi Hatası Toplanan verilerin, kodlanmasında, tasnifinde, analizinde veya yorumunda meydana gelen hatalardır. Örneğin, herhangi bir verinin bilgisayara yanlış girilmesi, yanlış sınıflandırılması, veri analizinde uygun olmayan yöntemlerin kullanılması, bulguların yanlış yorumlanması bu hataya yol açar.
Veri Özelliği ve Araştırma Amacına Göre Uygun Analizler
Anketör Hataları Cevaplayıcı Seçme Hatası Anketörlerin örnek kütle olarak belirlenmiş kişiler dışındakilerle araştırma yapması durumunda ortaya çıkar. Örnek: Anketörlerin alış veriş merkezlerinde alış veriş yapanlarla anket yapmaları gerekirken, kendi yakın çevrelerindeki kişilerle ya da evlerinde aile bireyleriyle anket yapmaları gibi. Olasılığa dayalı olmayan örnekleme yöntemlerinde, özellikle kolayda örnekleme yönteminde bu hataya sık rastlanır.
Anketör Hataları Soru Sorma Hatası Anketörün, anket formunda yazılı sorulara tam olarak bağlı kalmaması, soruları tam olarak sormaması, yazılı soruyu tam olarak okumak yerine kendi cümleleriyle orijinalinden faklı olarak sorması durumunda ortaya çıkar.
Anketör Hataları Kayıt Hatası Cevaplayıcı tarafından verilen yanıtların yanlış anlaşılması sonucunda yanlış olarak kaydedilmesiyle ortaya çıkar. Bu durum anketörün verilen cevabı duymaması ve/veya yanlış yorumlaması gibi nedenlerle ortaya çıkabilir.
Anketör Hataları Aldatma Hatası Anketörün anket formunu tamamen ya da kısmen kendisinin doldurması durumunda ortaya çıkar. Çoğu zaman, aldatma amacıyla anket formlarını kendileri dolduran anketörler, cevaplarda tutarsızlıklara yol açabilecek detaylara dikkat etmezler. Örneğin, 18 yaşında olduğunu ifade eden bir kişi 10 yıldır çalışıyor olduğunu söyleyebilir.
Cevaplayıcı Hataları Cevaplayıcıdan kaynaklanan cevaplama hatalarına özellikle, yaş, gelir, eğitim, siyasi görüş gibi demografik özellikleri sorgulayan sorularda oldukça sık rastlanır.
Cevaplayıcı Hataları Yetersizlik Hatası Cevaplayıcının doğru cevaplar verememesi durumunda ortaya çıkar. Cevaplayıcı, cevapları bilmediği veya yanlış hatırladığı için doğru cevap veremeyebilir.
Cevaplayıcı Hataları İsteksizlik Hatası Cevaplayıcıların doğru cevap vermek istemediği için cevap vermemesi durumunda ortaya çıkar. Özellikle, toplumca kabul görmeyecek, ayıp sayılabilecek etik dışı cevapları, doğru olsa bile vermekten çekinirler. Bazen cevaplayıcı, toplumca hatta anketörce takdir edilecek cevap alternatiflerine doğru bir eğilim taşıyabilir. Örneğin, hiç kitap okumayan biri, kasten çok kitap okuduğunu söyleyebilir.
Cevaplayıcı Hatalarını önlemek için Soruların doğrudan sorulması yerine dolaylı sorulması Kontrol soruları kullanılması Kontrol sorularının inceleneceğinin bildirilmesi
SİSTEMATİK HATALARI ÖNLEMEK İÇİN Anket çalışmasına başlamadan önce, olası hataları ortaya çıkaracak bir pilot çalışma yapılmalıdır
Örnek uygulama İşletme Fakültesindeki öğrencilerin internetten alış veriş davranışlarına ilişkin bir araştırmada, tesadüfi ve sistematik hataları önlemek için neler yaparsınız?
Örnek uygulama Şirketiniz, yeni bir marka ile yeni bir ürün olan gözleme sosunu piyasaya sürdü. Satışlarını artırmak için pazarlama departmanı tüketicilerin markayı satın alıp almayacaklarını ve pazarın büyüklüğünü bilmek istiyor. Bu bilgileri nasıl toplarsınız?
Örnek uygulama Şirketiniz yeni bir katlama cihazı yapar. Sen, tüketicilerin onun hakkında ne düşündüğünü ve onu satın almak için ne kadar ödemeye razı olduklarını öğrenmek istiyorsun. Anket tekniğini mi kullanırsın? Neden? Örneklemin kimlerden oluşur?
TEŞEKKÜRLER