İstatistik 1.Bölüm EĞITSEL YAZıLıM GELIŞTIRME VE DEĞERLENDIRME
İstatistik nedir? İstatistik, en genel yaklaşımla, 'sayısal bilgi', 'sayısal veri' ya da 'ham veri' olarak tanımlanmaktadır. Örneğin 'Ayşe, 45kg ağırlığındadır' ifadesindeki 45kg, Ayşe'nin 'ağırlık' olarak tanımlanan bireysel hakkında bir bilgi vermektedir ve bir istatistiktir. Bir diğer yaklaşıma göre istatistik, bir süreç tanımlamaktadır. Bir süreç olarak istatistik, bir veri seti üzerinde yapılan aşamalı işlemleri ifade etmektedir. Veriler üzerinde, temelde betimleme ve çıkarsama işlemleri yapılabilmektedir. Matematiksel temelleri olan bu tür işlemleri içeren süreçler 'istatistik' ya da 'istatistiksel yöntem ve teknikler' olarak ifade edilmektedir.
İstatistik, bilimsel araştırma ile istatistik ilişkisi kurularak da tanımlanabilmektedir. Temelde bir problem ya da güçlük durumuna çözüm üretme süreci ve çok yönlü bir etkinlik olan bilimsel araştırmalarda, araştırmacı, bir takım amaçlı gözlemlere bağlı olarak veriler elde etmekte ve bu verileri kullanarak olası çözüm önerilerini test etmektedir. Hipotez olarak bilinen bu olası çözüm önerilerinin test edilmesinde kullanılan yöntem ve teknikler, istatistik ya da istatistiksel yöntem olarak ifade edilmektedir.
İstatistiğe ilişkin temel kavramlar EVREN – ÖRNEKLEM Evren (population), gözlenmesi amaçlanan belli bir özelliğe sahip gözlem birimlerinin tamamını içeren en geniş gözlem kümesi olarak tanımlanır. Evren, 'ana kitle', 'ana kütle' ya da 'popülasyon' olarak da ifade edilebilmektedir. Örneklem (sample), belli bir özelliğin üzerinde gözlendiği ve evrenin bir alt kümesi olan gözlem birimleri kümesidir. Tanımlanmış bir evrenden bir örneklem belirleme işlemelerini içeren yöntem ve tekniklere 'örnekleme (sampling)' denir.
İstatistiğe ilişkin temel kavramlar İstatistiksel yöntemler, betimsel istatistik ve anlam çıkartıcı istatistik olmak üzere ikiye ayrılır. Betimsel istatistik, sayısal verilerin toplanması, betimlemesi ve sunulmasına yarayan yöntem ve teknikleri içerir. Betimsel istatistik, bir örneklem üzerinde yada ulaşabilen durumlarda evrende, gözlem yaparak elde edilen verileri kullanmak suretiyle üzerinde çalışılan grubun özelliklerini saptamayı amaçlayan süreçtir(Frekans, yüzde, merkez eğilim ölçüleri, korelasyon katsayısı vb.). Anlam çıkartıcı istatistik, örneklemden betimsel tekniklerle saptanan istatistiklere dayalı olarak evren değerlerine ilişkin doğru kestirimler yapılmasını sağlayan yöntem ve teknikler olarak tanımlar(T-testi, varyans analiz, kay-kare testi vb. ).
İstatistiğe ilişkin temel kavramlar Parametre- İstatistik
İstatistiğe ilişkin temel kavramlar DEĞİŞKEN – SABİT Durumdan duruma, konumdan konuma, bireyden birime, zamandan zamana, bağlamdan bağlama değişmeyen özelliklere 'sabit (constant) özellik', diğer tarafta değişen ya da farklılaşan özelliklere ise 'değişken (variable) özellik' denir. Örneğin cinsiyet, yaş, ağırlık, eğitim düzeyi, aylık gelir, okula devam ya da devamsızlık süresi gibi özellikler bireyden bireye farklılık gösterebilen bir özelliklerdir. Bu ve benzeri özellikler, amaçlanan bir gözlemde değişkenler olarak tanımlanır.
DEĞİŞKEN TÜRLERİ Nitel Değişken - Nicel Değişken Bazı değişkenler, sembollerle ya da sözcüklerle ifade edilir. Bazı değişkenler ise sayılarla ifade edilir. Sözcük ya da sembollerle ifade edilen değişkenlere 'nitel (qualitative)', sayılarla ifade edilen değişkenler ise 'nicel (quantitative)' değişken olarak adlandırılır. Örneğin cinsiyet, kadın ve erkek olarak değerler alabilen iki kategorili ve nitel bir değişkendir. Bir başka örnek olarak eğitim düzeyi, okuryazar değil, okuryazar, ilkokul mezunu, ortaokul mezunu gibi değerler alabilen çok kategorili ve nitel bir değişkendir. Yaş, ağırlık, öğrenme başarısı, akademik aşarı, sıcaklık, aylık gelir gibi değişkenler ise sayılarla ifade edilir ve bunlar nicel değişkenlerdir.
DEĞİŞKEN TÜRLERİ Sürekli Değişken - Süreksiz/Kesikli Değişken Matematiksel bir kavram olarak süreklilik, herhangi iki sayının ortasında her zaman bir üçüncü sayının bulunması durumunu ifade etmektedir. Örneğin doğal sayılar ve tamsayılar kümeleri, sürekli sayılar değildir. Rasyonel sayılar kümesi ise süreklidir. Cinsiyet, eğitim düzeyi, doğum yeri, kan grubu, şube gibi değişkenler kesikli, yaş, ağırlık, akademik başarı, öğrenme başarısı, tutum gibi değişkenler süreklidir. Genellikle nitel değişkenler kesikli, nicel değişkenler ise sürekli değişkenlerdir.
DEĞİŞKEN TÜRLERİ Bağımlı Değişken - Bağımsız Değişken Herhangi bir değişken, tek başına bağımlı ya da bağımsız olarak sınıflandırılamaz. Bu sınıflamanın yapılabilmesi için en az iki değişken ve bu değişkenler arasında tanımlı bir ilişki bulunmalıdır. İki değişkenden biri diğer değişkenle ilişkilendirildiğinde, ilişkinin yönüne göre, bağımlı-bağımsız sınıflaması yapılabilir. İlişkili iki değişkenden biri diğeri aracılığı ile (yani diğerine bağlı olarak) betimlenecek ya da açıklanacak ise açıklanan temel değişken 'bağımlı değişken (dependent variable)', bu değişkenle ilişkilendirilen diğer değişken ise 'bağımsız değişken (independent variable)' olarak adlandırılır.
DEĞİŞKEN TÜRLERİ Bağımlı Değişken - Bağımsız Değişken
ÖLÇEK VE ÖLÇEKLEME Özel kullanımıyla ölçek, genellikle tutum, ilgi, kişilik gibi duyuşsal özelliklerin gözlenmesinde ya da ölçülmesinde kullanılan özel bir veri toplama aracıdır. Diğer bir tanımlamayla ölçek, belli birimlerle birimlendirilmiş ve yapılandırılmış bir ölçme aracıdır. Bu özel kullanımının yanı sıra bir değişkenin alabileceği olası değerlere de ölçek denilmektedir. Bir değişkenin sayı ya da sembol olarak alabileceği değerler, bir ölçek üzerinde ifade edilmektedir. Bu değerlerin yani bir değişkenin alabileceği değerlerin belirlenmesi, değişkenin seçeneklerinin belirlenmesi işlemlerine de 'ölçekleme' denilmektedir.
ÖLÇEK VE ÖLÇEKLEME ÖLÇEK TÜRLERİ Dört tür ölçek düzeyi söz konusudur: 1. Sınıflama Ölçeği (Nominal scale) 2. Sıralama Ölçeği (Ordinal scale) 3. Eşit Aralıklı Ölçek (Interval scale) 4. Eşit Oranlı Ölçek (Ratio scale) Bu ölçek türleri, en az bilgi sağlayan ölçek türünden en çok bilgi sağlayan ölçek türüne doğru sıralı olarak verilmiştir. Aynı şekilde aralarında kapsama ilişkisi de vardır. Yani bir üst düzey, alt düzeyleri kapsamaktadır.
ÖLÇEK VE ÖLÇEKLEME ÖLÇEK TÜRLERİ Dört tür ölçek düzeyi söz konusudur: 1. Sınıflama Ölçeği (Nominal scale) 2. Sıralama Ölçeği (Ordinal scale) 3. Eşit Aralıklı Ölçek (Interval scale) 4. Eşit Oranlı Ölçek (Ratio scale)
ÖLÇEK TÜRLERİ Sınıflama ölçeği düzeyindeki bir değişken, sadece grup ya da gruba aidiyet hakkında bilgi verir. Örneğin kan grubu, doğum yeri, cinsiyet, şube, medeni durum gibi değişkenler sınıflama ölçeği düzeyinde değişkenlerdir. Sıralama ölçeği düzeyindeki değişkenler, gruba aidiyet bilgisi yanı sıra kategoriler arasında bir sıra ilişkisi de gösterir. Örneğin anne eğitim düzeyi, sıralama ölçeğinde bir değişkendir. Örneğin lise mezunu olman bir anne, ortaokul mezunu olan bir anneden daha yüksek bir eğitim düzeyine sahiptir.
ÖLÇEK TÜRLERİ Eşit aralıklı ölçek düzeyindeki bir değişkende değişkenin alabileceği ardışık değerler arasında eşit mesafe vardır. Yani bu değişkenin değerlerinin yer aldığı ölçek, eşit aralıklıdır. Örneğin öğrenme başarısının bir göstergesi olarak 'not' şeklinde tanımlanan değişken, 0 ile 100 arasındaki notlardan oluşuyorsa bu değişken eşit aralık ölçeğindedir. Yani 1 notu ile 2 notu, 2 notu ile 3 notu ve benzeri arasındaki mesafeler birbirine eşittir. Eşit aralıklı ölçek düzeyindeki bir değişkende 'izafi/göreli/yapay sıfır' ya da 'izafi başlangıç noktası' tanımlıdır. Bu nokta mutlak yokluğu ifade etmez. Örneğin notu ‘0’ olan bir öğrencinin öğrenemediği dolayısıyla öğrenme başarısı bulunmadığı söylenemez.
ÖLÇEK TÜRLERİ Eşit oranlı ölçekte düzeyindeki bir değişkende de ölçekleme, eşit aralıklıdır. Fakat eşit aralık ölçeğinden farkı, 'gerçek/mutlak sıfır' noktasına sahip olmasıdır. Örneğin ağırlık, eşit oranlı ölçek düzeyinde bir değişkendir. ‘0’ kg, ağırlığın olmadığını yani mutlak yokluğu ifade eder.
FREKANS DAĞILIMLARI 2.BÖLÜM Nicel Verilerde Frekans Tabloları Bir doğumevinde bir ayda doğan 120 erkek bebeğin ağırlıkları Tablo 1.1 de verilmiştir: Tablo 1.1: 120 erkek bebeğin ağırlıkları(kg)
FREKANS DAĞILIMLARI 2.BÖLÜM Nicel Verilerde Frekans Tabloları Bir doğumevinde bir ayda doğan 120 erkek bebeğin ağırlıkları Tablo 1.1 de verilmiştir: Tablo 1.1: 120 erkek bebeğin ağırlıkları(kg)
Sınıf Değişkenin değer aralığı birbirinden kesin olarak ayrılmış gruplara bölünebilir, bu gruplara sınıf adı verilir. Genellikle frekans dağılım tablolarında 8-10 sınıf yapılır. Sınıf sayısının 8'den az ve 15'den fazla olmamasına dikkat edilir. Eğer sınıf sayısı 15'i geçerse özetlemeden beklenen amaca ulaşılmamış olur. Sınıf sayısı k ile gösterilir. Sınıf sayısının belirlenmesinde aşağıda verilen Sturges formülü de kullanılabilir: k = log (n) Formülde n veri sayısıdır.
Frekans Dağılımları Dağılım Sınırları: Örneklemdeki en küçük değer ile en büyük değere dağılım sınırları denir. Dağılım Genişliği: Bir örneklemde en büyük değer ile en küçük değer arasındaki farka dağılım genişliği denir, R ile gösterilir. Sınıf Aralığı: İki sınıf arasındaki farka sınıf aralığı denir, c ile gösterilir.
Frekans Dağılımları Alt Sınır: Bir sınıfın en küçük değeridir, As ile gösterilir. Üst Sınır: Bir sınıfın en büyük değeridir, Üs ile gösterilir. Sınıf Değeri: Bir sınıfın alt sınır ve üst sınır değerlerinin ortalaması sınıf değeridir, Si ile gösterilir. Frekans (Sıklık): Bir sınıfa düşen veri sayısına frekans denir, f ile gösterilir. Frekansların toplamı veri sayısına eşit olmalıdır. Yani, dir. Göreli Frekans (Frekans Yüzdesi): Her sınıfa düşen veri sayısının toplam veri sayısına oranına denir, p ile gösterilir.
Frekans Dağılımları
Nitel Veriler için Frekans Tablosu Nitel veriler için sınıflama ve sıralama ölçme düzeyinin kullanılabileceği daha önce ifade edilmişti. Sınıflanabilen ve sıralanabilen verilerde sınıflar birbirinden bağımsız olduğu için frekans tablosunda sadece sınıf, frekans ve göreli frekans sütunları yer alır. Örnek 1.2: Bir hastaneye müracaat eden hastaların 400’ü verem, 300’ü kalp, 200’ü kanser, 100’ü grip ve 200’ü diğer hastalık türüne sahiptir. Bu verilere ilişkin frekans tablosu Tablo 1.4 de verilmiştir. Tablo 1.4: Hastalık türüne göre hasta sayısı
Grafikler Çubuk Grafiği Dağılım çubukları grafiği, kesikli nicel verilerde ve nitel verilerde kullanılır. Çubuk grafiğinde sınıflar, tabanları eşit ve birbirine bitişik olmayan dikdörtgenlerle temsil edilir. Tablo 1.4. de verilen frekans tablosu için çubuk grafiği aşağıda verilmiştir.
Grafikler Çizgi Diyagramı Frekans dağılımında her sınıfın düzlemde bir nokta ile temsil edilip, sonra bu noktaların birleştirilmesiyle elde edilen şekle çizgi diyagramı denir. Sürekli veriler için kullanılan bir grafik türüdür. Tablo 1.2. de verilen frekans tablosu için çizgi diyagramı aşağıda verilmiştir.
Grafikler Histogram(Dağılım Dikdörtgenleri) Histogram, koordinat sisteminde, tabanları frekans tablosundaki her bir sınıfın sınıf büyüklüğü, yükseklikleri bulunduğu sınıfın frekanslarıyla orantılı olarak yan yana çizilen dikdörtgenlerden oluşur. Tablo 1.2. de verilen frekans tablosu için histogram aşağıda verilmiştir.
Grafikler Daire (Pasta)Grafiği Her sınıfa düşen frekansın bir dairenin parçası ile gösterildiği grafik türüdür. Bu grafiği çizebilmek için göreli frekanslar hesaplanır. Her sınıfa ilişkin göreli frekans 3600 ile çarpılarak o sınıfa ilişkin daire dilimleri bulunur. Tüm sınıflar için yapıldığında daire tamamlanmış olur. Daha çok sınıflandırılabilen verilerde kullanılır. Tablo 1.4. de verilen frekans tablosu için daire grafiği aşağıda verilmiştir.
Frekans Dağılımlarının Betimlenmesi Merkezi Eğilim Ölçüleri Konum ölçüleri ya da bir grup ölçüme ilişkin tipik puanlar olarak da bilinen merkezi eğilim ölçüleri, ilgilenilen değişkene ait bir grup ölçümün ortalama durumunu yansıtır.
Aritmetik Ortalama Aritmetik ortalama, en çok kullanılan merkezi eğilim ölçüsüdür. Birimlerin belirli bir değişken bakımından aldıkları değerlerin toplamının birim sayısına bölümü olarak tanımlanır. Eşit aralıklı ve oran ölçme düzeyinde ölçülen değişkenler için kullanılır. Aritmetik ortalama hem kitle hem de örneklem için hesaplanır.
Aritmetik Ortalama
Frekans Dağılımlarının Betimlenmesi En sık kullanılan merkezi eğilim ölçüleri Aritmetik ortalama, Ortanca ve Mod’dur.
Mod (Tepe Değer) Bir veri grubunda en çok tekrar sonucuna mod denir. Mod, verilerin en çok tekrar eden değer etrafında toplandığını ifade eden bir ölçüdür. Veri grubunu betimlemede, tüm verilerden ziyade en çok tekrar eden verinin kullanılmasından dolayı mod, diğer merkezi eğilim ölçülerine kıyasla veriler hakkında en az bilgi veren ölçüdür.