Biyoistatistik- Ders 2 Dr. Kübra Akdur
Betimleyici İstatistik, Temel İstatistiksel Kavramlar Deney Birimi (Case): • İnceleme ve araştırmaya konu olan özellikleri taşıyan ve bu özelliğin değerlerini (VERİ) elde ettiğimiz toplumun en küçük ögesine, parçasına birim adı verilir. • Deneysel çalışmalarda birimlere denek adı da verilmektedir. • Denek kişi ise birim=birey’dir. • Birim, canlıdır (birey, kişi, deney hayvanı, cell). • Birim, cansızdır (obje, madde, kurum ya da kuruluş). • Birim, gözlenebilen bir oluşum/belirti setidir (doğum, hastalık, ölüm).
Temel İstatistiksel Kavramlar Olay, Oluşum (Fenomen): Toplumda birimlerde ortaya çıkan ve üzerinde çalışmalar yapmak gereği duyulan oluşumlara Olay adı verilir. Doğum, Ölüm, Hastalık, Kan basıncı, Boy, Ağırlık vb. İstatistiksel Olay: Araştırmaya, incelemeye konu teşkil eden gözlenebilen, deneysel olarak varlığı kanıtlanabilen ve sayılarak, ölçülerek ya da tartılarak sayısal biçimde ifade edilebilen olaya, istatistiksel olay adı verilir. Kitle (Populasyon, Yığın, Evren): İstatistiksel olayın gözlendiği, gözlenebildiği birimler topluluğuna kitle adı verilir. İlgilenilen tüm nesne ya da bireylerden bir özelliğe ilişkin elde edilen ölçüm değerleri de kitle olarak tanımlanabilir. Hedef Kitle: Özellikleri üzerinde araştırma yapılacak topluma hedef kitle denir.
Temel İstatistiksel Kavramlar Örneklem (Sample): Bir kitleden, kitleyi temsil edecek nitelik ve sayıda seçilen, araştırılan özellikleri taşıyan ve gözleme alınan alt gruba denir. n simgesi ile gösterilir. Örnekleme (Sampling): Kitleden örnek seçmek amacıyla geliştirilen çeşitli yöntemler vardır. Uygun yöntemlerle kitleden örneklem seçme işlemine “örnekleme” denir.
Temel İstatistiksel Kavramlar Biyolojik Değişkenlik: Toplumdaki birimlerin doğasından gelen, değişkenlerde ortaya çıkan açık nedeni bilinmeyen (genetik faktör, Doğal etki, Fizyolojik faktör, vb.) farklılaşmaya biyolojik değişkenlik adı verilir. • Birimlerin; biyolojik, fizyolojik, morfolojik özelliklerinde belirli değerler arasında olmak üzere rasgele farklılıklar gözlenir. • Rasgele değişkenliğin bir bölümü bilinen ve açıklanabilen nedenlere bağlıdır, bir bölümü de açıklanamayan nedenlere bağlıdır. Canlı birimler arasındaki açıklanamayan bu farklılığa biyolojik değişkenlik denir.
Temel İstatistiksel Kavramlar Değişken (Variable): Birimlerin; ölçülen, tartılan, sayılan ve birimden birime değişik değerler alabilen nitel (kalitatif) ve nicel (kantitatif) özellikleridir. Bir gözlem/deney biriminden diğerine farkılık gösterir. Değişkenler, özelliğin isimi ile yada kısaca X, Y, Z,..., gibi harflerle ya da X1, X2, X3,... Y1,Y2,Y3... Gibi harf+rakam ile gösterilir. Veri/Data: Birimlerden elde edilmiş ve kaydedilmiş bir ya da daha fazla değişkenin değerler setine veri denir. Veriler, incelenen değişkenlerin sayım, ölçüm ya da tartım sonucu elde edilen kayıtlanmış sayısal bilgileridir. Değişkenin aldığı değerdir. Veri, cm ,kg, TL vb ölçülerle ifade edilebildiği gibi niteliksel tanımların da bir ölçüm olarak dikkate alınması gerekir. Veri Dizisi/Veri seti/Veri matrisi : Verilerin sayısal değerlerini topluca gösteren sunum biçimine/ gösterimine verilen addır.
Değişkenler ve Veri Tipleri
Değişkenlerin Ölçme Düzyleri Veriler nicel ve nitel tip olarak ikiye ayrıldı. Ayrıca veri 4 ölçme düzeyinde sınıflanıdırılır. Bu düzeyler veri için uygun olan aritmetik işlemleri belirler. Sınıflama (Nominal) Ölçme Düzeyi: İsim, etiket, sınıf, kategori içeren verilere uygundur. Verilerin küçükten büyüğe sıralanması gibi hiç bir kriter bulunmaz. Veri değerleri arasında fark alınamaz ve anlamsızdır. Sıralama (Ordinal) Ölçme Düzeyi: Belli bir sırada düzenlenebiln veriler için kullanılır. Veri değerleri arasındaki fark belirlenemez veya anlamsızdır. Nominal düzeyde ölçülmüş veriler için bir üstünlük derecelendrilmesi yapılamaz. Ordinal veriler için bir üstünlük sıralaması yapılabilir. Aralıklı (Interval) Ölçme Düzeyi: Belli bir sırada düzenlenebilen veriler için kullanılır. Veri değerleri arasındaki farklar anlamlıdır. Gerçek sıfır noktası yoktur. Sıcaklık bu ölçme düzeyinde ölçülür. Farklı birimleri vardır: santigrat, fahrenheit, kelvin gibi. Kat, oran işlemleri yapılamaz. Oransal (Ratio) Ölçme Düzeyi: Belli bir sırada düzenlenebilen verileri için kullanılır. Veri değerleri arasındaki farklar, oranlar anlamalıdır. Gerçek sıfır noktası vardır. Para, TL, kg, cm...
Değişkenlerin Ölçme Düzeyleri
Nitel Değişken/ Veriler Nitel veriler, verilerin elde ediliş biçimine (ölçeklerine göre) üç alt gruba ayrılır. Bunlar; İsimsel veri (Nominal data), Sıralı veri (Ordinal data) ve Yaklaşık aralıklı veri (Near Interval data) olarak adlandırılır. Nominal (Sınıfsal) veri: Nitel verilerin kategorilerinde herhangi bir sıra yok ise bu tür verilere sınıflanabilir nitel veri denir (Cinsiyet, Kan grubu, Medeni Durum,…) Birimlerin isimle belirtilen değerler aldığı değişkenler ve bu değişkenlerin verilerine verilen isimdir. Burada isimsel seçenekler arasında bir ardışıklık (hiyerarşi, sıralama) sözkonusu değildir. Örneğin; Cinsiyet, Kadın ve Erkek olarak iki (Binary) değer alır. İsimsel veriler içerdikleri seçenek sayılarına göre İkili (Binary, Dichotomous) ve Çok seçenekli (Multinomial, Polytomous) olarak da ifade edilirler. Örneğin; Medeni durum, bekar, evli, eşi ölmüş ve boşanmış olarak çok seçenekli değerler alır. Bu nedenle medeni durum verileri çok seçenekli bir veri türüdür.
Nitel Değişken/ Veriler Ordinal (Sıralanabilir) veri: Nitel verilerin kategorilerinde herhangi bir sıra var ise bu tür verilere sıralanabilir nitel veri denir. Gözlem seçenekleri arasında ardışıklık (hiyerarşi, sıralama) bulunan değerler alabilen değişkenler ve bu değişkenlerin verilerine verilen isimdir. Sıralı verilerde seçenekler arasında bir büyüklük sıralaması vardır. Örneğin; birimin vücut kitlesi (body mass), Zayıf, Normal, Şişman, Obez olarak ardışık bir nitelemeye göre değerlendirilir. Bir oluşumun nitel değerlendirilmesinde yararlanılan seçenekler Kötü, Orta, İyi, Pekiyi gibi bir ardıl yapı içeriyorsa bu değişken sıralı değişken ve veriler sıralı verilerdir. Yaklaşık aralıklı veri : Uzman Tanımlı Skor Veri olarak da bilinir. Konu Uzmanları tarafından belirlenmiş ve genel Kabul görmüş puanlama sistemine göre değerleri saptanan değişkenler ve elde edilen verilerdir. Örneğin hastalık şiddeti, ağrı şiddeti gibi ölçülüp tartılamayan özellikler uzmanlarca geliştirilen ve “Hastalık Şiddeti Skorlaması” ya da “Ağrı Şiddeti Skorlaması” gibi isimlendirilen yöntemlerle değerlendirilirler.
Nicel Değişkenler/ Veriler Ölçek Tanımlı Skor Veri: Skorlama ölçekleri (Likert, Thurstone, Osgood, Goodman) ile belirlenen Skor veriler) Sağlık Durum Ölçekleri, Beğeni Ölçekleri, Kişilik Ölçekleri, BPRS, SF36, Duygu‐Durum Ölçeği, Memnuniyet Ölçeği vb. Aralıklı Veri (Interval) : Sınıf/Grup sınırlarına göre elde edilmiş veri, Yaş Grupları (0‐4, 5‐9, 10‐14, 15‐24, 25‐44, 45‐64, 65+) Oransal Veri (Ratio/Proportional scale): Fiziksel araçlarla ölçülmüş, tartılmış veri. Yaş (24, 56, 40, 38, 72 ; Boy (172, 165, 178, 194, 169 vb.); Ağırlık (76.560, 62,750, 86.735, … vb.) SKB, DKB, Hg, TotalKollest, HDL, LDL vb.
Nicel Değişkenler/ Veriler Ölçek Tanımlı Skor/Puan (Scale Specific Score Data) Doğrudan değerleri ölçüm, tartım ya da sayımla elde edilemeyen, eğilim, beğeni, tutum, davranış ve tepki fenomenlerinin sayısallaştırılması için kullanılan Likert, Thurstone, Goodman vb. ölçekler yardımı ile değerleri berlirlenen değişkenler ve verilere verilen isimdir. Örneğin; hasta memnuniyeti, stres düzeyi, bilgi-tutum ve davranış düzeyleri.
Nicel Değişkenler/ Veriler Aralıklı (Interval) Değişken/ Aralıklı Veri: Birimlerin önceden belirlenen değer aralıklarına göre değerler aldığı değişkenler ve bu değişkenlerin verilerine verilen isimdir. Burada değişkenin alabileceği değerler önceden belirlenen iki değer aralığına ya da kesikli bir değere göre belirlenirler. Bu aralıklar (sınıflar) belirlenirken her bir sınıfın alt ve üst sınırları önceki ve sonraki sınıfların sınırları ile karışmazlar. Birimler aralıklı veriler bakımından sadece bir tek sınıfta yer alabilirler.
Nicel Değişkenler/ Veriler Oransal (Proportional/Ratio) Değişken / Veri: Değerleri Ölçüm ve Tartım sonucu belirlenebilen değişkenler ve bu değişkenlerin verilerine verilen isimdir. Fiziki araç ve gereçlerle (uzunluk, hacim, ağırlık, yoğunluk, basınç, akım şiddeti, direnç vb. ölçen araçlar) ile değerleri belirlenebilen değişkenler ve elde edilen veriler Oransal özelliktedirler. Örneğin; birimin vücut ağırlığı, boy uzunluğu, Sistolik kan basıncı, hemoglobin, kolestrol düzeyi, trigliserit, açlık kan şekeri vb. değişkenleri farklı ölçüm tekniklerine göre değerleri belirlenebilir. Oransal veriler değişkenin doğrudan ölçülen değerleridir.
Temel İstatistiksel Kavramlar Bağımsız (Açıklayıcı) Değişken (X): Değeri bağımsız olarak oluşan, başka değişkenlerin değişimi üzerinde etkide bulunan (faktör) değişkenleridir. Bağımlı (Yanıt) Değişken (Y): Değeri başka değişkenler (faktörler) tarafından etkilenerek değişen değerlerdir.
Temel İstatistiksel Kavramlar Faktör/Faktör Değişken: Birimlerin nitel ya da nicel özelliklerinin değişimi üzerinde etkilerde bulunduğu kabul edilen dışsal etmenler (çevresel, sosyal, kültürel vb.), incelenen değişkenle aralarında neden- sonuç ilişkisi bulunan kategorik bağımsız değişkenlerdir. Karıştırıcı Değişken/(Confounding Variable): Y’yi etkilediği varsayılan X1 ve X2 gibi açıklayıcı değişkenlere ek olarak ilişkiyi karıştıran yönlendiren değişkenlerdir. Ortak Değişken/Covariate: Y ile birlikte değişen Y’nin değişimini yönlendiren değişkendir.
Temel İstatistiksel Kavramlar Frekans: Bir araştırma değerlendirmesinde değişkenin aynı değeri taşıyan birim sayısına frekans denir. Belirli değerler arasında özellikleri olan birim sayıları da frekans olarak alınır. Veriler elde edildikten sonra belirli bir X değerinin kaç birimde gözlendiğini ifade etmek için frekans sözcüğü kullanılır. Örneğin, 100 hastanın SKB değerleri ölçülmüş ve 140 mm/Hg ve daha fazla değere sahip birim sayısı 54 ise frekans f(140+mmHg)=54 olarak belirtilir. Frekans=Mutlak/Sayısal Frekans (Frequency) Göreli Frekans/Yüzde Frekans/Relative Frequency Yığılımlı Frekans/Cumulative Frequency
Temel İstatistiksel Kavramlar Parametre(Parameter): Kitlenin özelliklerini tanımlamak için kullanılan ölçülere denir. İstatistik (Statistics): Örneklemin özelliklerini tanımlamak için kullanılan ölçülere denir. İstatistik ile parametre gösterimleri birbirlerinden farklıdır. Parametre göstermek için Eski Yunan harfleri kullanılırken, istatistik gösterimlerinde Türkçe küçük ya da büyük harfler kullanılır. ÖZELLİK KİTLE ÖRNEKLEM Deney Birimi Sayısı 𝑁 𝑛 Standart Sapma 𝜎 𝑆 Varyans 𝜎 2 𝑆 2 Aritmetik Ortalama 𝜇 𝑋
Temel İstatistiksel Kavramlar Hipotez: Gözlemlere, kuramlara ya da sezgiye dayalı olarak oluşturulan, araştırılan konu ile ilgili gerçekleşmesi beklenen bir durumu belirten önermedir. Hipotezin doğru olması ya da gerçekleşmesi söz konusu olmayabilir. “Araştırma ve İstatistik ayrılmaz bir bütündür. Araştırmacı, İstatistik yöntemlere daha işin başında başvurmalıdır, sonunda değil …!” A. Bradford Hill, 1937