Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

İSTATİSTİK BİLİMİ. İÇİNDEKİLER 1.İSTATİSTİK………………………………………………….23 1.1. İSTATİSTİK KELİMESİNİN ANLAMI………………...24 1.2.İSTATİSTİĞİN TANIMI………………………………….35.

Benzer bir sunumlar


... konulu sunumlar: "İSTATİSTİK BİLİMİ. İÇİNDEKİLER 1.İSTATİSTİK………………………………………………….23 1.1. İSTATİSTİK KELİMESİNİN ANLAMI………………...24 1.2.İSTATİSTİĞİN TANIMI………………………………….35."— Sunum transkripti:

1 İSTATİSTİK BİLİMİ

2 İÇİNDEKİLER 1.İSTATİSTİK………………………………………………… İSTATİSTİK KELİMESİNİN ANLAMI……………… İSTATİSTİĞİN TANIMI………………………………… İSTATİSTİK SÖZCÜĞÜNÜN KÖKENİ…………… İSTATİSTİK KURAMININ GELİŞMESİ……………… İSTATİSTİK ARAŞTIRMANIN AMACI……………… GÜNÜMÜZDE İSTATİSTİĞİN ÖNEMİ………………44

3 2.İSTATİSTİK TABLOLAR………………………………… TABLO TİPLERİ………………………………………… TABLONUN KISIMLARI……………………………… TABLONUN ADI……………………………………… BAŞLIK………………………………………………… ÖN SÜTUN………………………………………….… GÖVDE…………………………………………………54

4 2.3. TABLO DÜZENLENİRKEN GÖZ ÖNÜNDE TUTULMASI GEREKEN BAZI NOKTALAR………… BASİTLİK…………………………………………… KAYNAK……………………………………………… TABLONUN ŞEKİL VE BÜYÜKLÜĞÜ…………… TABLO NUMARASI………………………………… KISALTMALAR VE DENDEN (“ ”) İŞARETLERİ..66

5 2.3.6.ÖNEMLİ MADDELERİN BELİRLENMESİ……… MUKAYESE KOLAYLIĞI…………………………… ÖLÇÜ BİRİMLERİ…………………………………… VERİLERİN YUVARLAKLAŞTIRILMASI………… TABLOLARDA KULLANILAN İŞARETLER…...… VERİLERİN SIRALANMASI…………………………… BÜYÜKLÜK……………………………………………80

6 2.5. İSTATİSTİĞİN FAYDALARI…………………………….82 3.İSTATİSTİĞİN UYGULAMA ALANLARI………………… KAMU HİZMETLERİNİN GÖRÜLMESİNDE İSTATİSTİĞİN ROLÜ……………………………………… BİLİMSEL ARAŞTIRMLARDA İSTATİSTİĞİN ROLÜ PSİKOLOJİDE İSTATİSTİK…………………..………… BETİMSEL İSTATİSTİK………………………………….91

7 3.5.MUHAKEME İSTATİSTİĞİ…………………………… İSTATİSTİĞİN FAYDALARI………………………… İSTATİSTİĞİN BÖLÜMLERİ……………………......… TANIMLAYICI İSTATİSTİK………………………… SINIFLAMA…………………………………………… GRUPLAMA………………………………………… SERİLER……………………………………………….121

8 4.1.4.FREKANS VE YÜZDE……………………………… ARİTMETİK ORTALAMA………………………… MEDYAN……………………………………………… MOD…………………………………………………… STANDART SAPMA………………………………… ANALİZCİ İSTATİSTİK………………………………..129

9 4.3.ÖRNEK VE ANA KÜTLE…………………………… PARMETRİK ANALİZ TEKNİKLRİ………………… TEK-GRUP T-TESTİ……………………………… İKİ BAĞIMSIZ GRUP ARASI FARKLARIN TESTİ BAĞIMLI İKİ GRUP ARASINDAKİ FARKLARIN TESTİ………………………………………………………… ANOVA VE ONE-WAY ANOVA……………………….152

10 4.5.PARAMETRİK OLMAYAN ANALİZ TEKNİKLERİ MANN WHITNEY U TESTİ……………………… İŞARET TESTİ……………………………………… WILCOXON İŞARETLİ – SIRALAR TESTİ……… WALD WOLFOVITZ SIRA (Runs) TESTİ………… BİNOM TESTİ……………………………………… KOLMOGOROV -SMIRNOV (K-S) TESTİ……….162

11 4.5.7.TEK - GRUP KI – KARE TESTİ…………………… FRIEDMAN TESTİ………………………….……… İKİ-GRUP MEDYAN TESTİ……………………… İKİ GRUP WALD WALFOVITZ TESTİ……..… İKİ GRUP KOLMOGOROV – SMİRNOV TESTİ K-GRUP MEDYAN TESTİ………………………… KRUSKAL - WALLİS TESTİ………………………..170

12 Kİ-KARE TESTİ…………………………………… İSTATİSTİK BİLİMİNDE BAĞZI KAVRAMLAR…...… VERİLERİN TOPLANMASI………………………… VERİLERİN TASNİF EDİLMESİ…………………… NOMİNAL ÖLÇEK………………………………… SIRALAMA ÖLÇEĞİ………………………………… ARALIK ÖLÇEĞİ………………………………...….184

13 5.2.4.ORAN ÖLÇEĞİ……………………………………… VERİLERİN DÜZENLENMESİ……………………… ZAMAN SERİLERİ………………………….……… MEKAN (KESİT) SERİLERİ……………………… DAĞILMA SERİLERİ……………………………… BASİT SERİLER…………………………………… FREKANS SERİSİ DAĞILIMI……………………191

14 GRUPLANDIRILMIŞ FREKANS SERİSİ…… VERİ ANALİZİ VE İSTATİSTİK………………………… KODLAMA 1…………………………………………… KODLAMA 2…………………………………………… TEK DEĞİŞKEN ANALİZİ………………………… İLİŞKİ ÖLÇÜMLERİ………………………………… SINIFLAMA DEĞİŞKENLERİ……………………..202

15 6.4.2.SIRALAMA DEĞİŞKENLERİ……………………… EŞİT ARALIKLI VEYA ORANLI DEĞİŞKENLER KORELASYON VE REGRESYON…………………… BİLEŞİK DAĞILIM SERİLERİNİN ANALİZİ……… DOĞRUSAL REGRESYON VE KORELASYON…… BASİT DOĞRUSAL REGRESYON…………………… REGRESYON KATSAYININ TESTİ…………………..225

16 7.5.KORELASYON ANALİZİ……………………………… KORELASYON KATSAYISI İLE İLGİLİ HİPOTEZ TESTLERİ………………………………………………… SIRA KORELASYONU……………………………… ÇOKLU REGRESYON VE KORELASYON…………248 8.STANDART SAPMA……………………………………… RASSAL DEĞİŞKEN İÇİN STANDART SAPMA……270

17 8.2.ANAKÜTLE STANDART SAPMA DEĞERİNİN ÖRNEKLEM STANDART SAPMA KULLANILARAK KESTİRİM………………………………………………… BİR SÜREKLİ RASSAL DEĞİŞKEN İÇİN STANDART SAPMA…………………………………………………… STANDART AÇIKLAMA VE UYGULAMA…………280

18 8.5.NORMAL DAĞILIM GÖSTEREN VERİLER İÇİN KURALLAR……………………………………………… ÇEBİŞEV’İN EŞİTSİZLİĞİ…………………………… STANDAT SAPMA VE ORTALAMA ARASINDAKİ İLİŞKİ……………………………………………………… PARAMETRİK OLMAYAN İSTATİKSEL TEKNİKLER ANAKÜTLE………………………………………………299

19 9.2.ÖRNEK………………………………………………… ŞANS ÖRNEĞİ………………………………………… PARAMETRE…………………………………………… PARAMETRİK OLMAYAN TEKNİKLERİN AVANTAJLARI…………………………………………… PARAMETRİK OLMAYAN TEKNİKLERİN DEZAVANTAJLARI……………………………………….311

20 9.7.PARAMETRİK OLMAYAN İSTATİSTİK TEKNİKLER NE ZAMAN KULLANILIR……………………………… İSTATİSTİK NE İŞE YARAR? İSTATİSTİK İLE İNSAN DAVRANIŞLARININ RASYONELLİĞİ ÖLÇÜLEBİLİR Mİ? HİSTOGRAM…………………………………………… MATEMATİK İSTATİSTİK VE GÜVENİLİRLİK…….361

21 12.1.ÇEVREMİZDEKİ İSTATİSTİKLER………………… MATEMATİKSEL İSTATİSTİK VE OLASILIK…… PERMÜTASYON…………………………………… ÇARPMA İLKESİ……………………………… TOPLAMA İLKESİ……………………………… n FAKTÖRİYEL(n!)……………………………… TEOREM 1………………………………………..377

22 TEOREM 2………………………………………… KOMBİNASYON……………………………………… İKİ TERİMLİ (BİNOM) KATSAYILAR! ÇOK TERİMLİ (MULTINOMIAL) KATSAYILAR TEOREM…………………………………………… ARAŞTIRMA, İSTATİSTİK VE YÖNETİM………………391 KAYNAKLAR……………………………………………………426

23 1.İSTATİSTİK

24 1.1. İSTATİSTİK KELİMESİNİN ANLAMI “İstatistik” ilk kez 18. yüzyılda Almanya‘da kullanılmaya başlanmıştır: İstatistik kelimesi sözü edilen yüzyıl başında devlet veya resmi kuruluşlar tarafından ülke hakkında toplanan bilgileri anlatmak için kullanılmıştır.

25 İstatistiğe ilişkin en eski temel kavram sayımdır ve çok eski çağlarda insan ve mal sayımıyla ilgili örneklere rastlanılmıştır. Günümüzde “İstatistik” kelimesi daha çok devlet veya resmi kuruluşlarca olmak üzere her türlü kuruluş tarafından bir ülkenin tamamı veya bir bölümü için toplanan bilgileri belirtmek için kullanılmaktadır.

26 Birçok garp dillerinde olduğu gibi dilimizde de “İstatistik” kelimesi daha çok iki anlamda kullanılmaktadır: İstatistik veriler, İstatistik bilimi,

27 İstatistik veri, sayı ile ifade edilen kollektif ve yaklaşık bilgiler olup istatistik kelimesi bu anlamda daima çoğul halde kullanılır. Eğitim istatistikleri, tarım istatistikleri, dış ticaret istatistikleri gibi.

28 İstatistik kelimesinin istatistik bilimi anlamı: yakın zamana gelmeye kadar istatistiğin bağımsız bir bilim kolu sayılıp sayılmaması gerektiği hakkında bir görüş birliğine varılamamıştı. Bir kısım bilginler istatistiği diğer bilimlerin araştırmalarında yararlandıkları metot ve tekniklerden ibaret saymakta idiler.

29 İstatistiğin bağımsız bir bilim kolu sayılmasına karşı olanların tezi şu şekilde özetlenebilir:  Kendisine özgü bir konusunun olmayışı. İstatistiğin kendisine özgü bir konusu yoktur.  Bir bilim kolunun bazı kanunlar ortaya çıkarması gerekir. İstatistiğin bulduğu bir kanun yoktur.

30  Bir bilim kolunun bütün için ortaya çıkardığı genel yargılar bütünü oluşturan kısımlar için de aynı derecede sağlam olduğu halde istatistikle bir yığın hakkında ortaya çıkarılan genel yargılar yığının kısımları veya birimleri hakkında bir anlam taşımamaktadır.

31 İstatistiği başlı başına bir bilim kolu sayanların cevapları ise şu şekildedir:  Konu: İstatistik sadece yığın olaylarını inceler. Bunun için kendisine özgü bir konusu vardır.  Kanun: İstatistiğin ortaya koyduğu bir “Büyük Sayılar Kanunu” vardır. Bu kanun şu şekilde ifade edilir:

32 Gözlem sayısı arttıkça ana eğilimi pozitif ve negatif yönde sapmaya zorlayan geçici ve tesadüfi sebeplerin etkileri daha büyük ölçüde birbirini yok edecek yığın olayının ana eğilimi gerçeğe daha yakın olarak belirir. Başka bir deyişle gözlem sayısı arttıkça olay üzerinde pozitif yöndeki etkilerin negatif yöndeki etkilere oranı gittikçe 1’e yaklaşır.

33  Genel Yargılar: İstatistik yığın olaylarını inceler. Olayın bir özelliğinin belirtilmesi veya olay hakkında bir genel yargının ortaya konması için gözlem sayısının veya yığını oluşturan birim sayısının yeteri kadar büyük olması gerekir. Bu, büyük sayılar kanununun gereklerindendir.

34  Zaman ve yer: İstatistiğin ortaya koyduğu genel yargıların ancak belli bir yerde ve zamandaki bir yığın için doğru olup başka yer ve zamanlar için bir değer taşımadığı şeklindeki yargıda hatalıdır. Aynı nitelikte ve yeteri kadar büyüklükte alındığı taktirde bir yığın olayı için bulunan bir genel yargının zaman ve yer değişikliği ile değerinden bir şey kaybetmediği görülür.

35 1.2.İSTATİSTİĞİN TANIMI 19.yüzyılda Belçikalı İstatistikçi Quetelet 100’ü aşkın değişik istatistik tanımının varlığını ortaya koymuştur yılında La Haye uluslar arası istatistik kongresinde. Alman istatistikçi Engel birbirinden farklı 180 tane istatistik tanımı belirlediğini ifade ederek adete istatistik tanımlarının istatistiğini yapmıştır.

36 Yapılan istatistik tanımlarından birkaçı aşağıdadır:  Yığın olaylarını inceleyen ve bunlara ilişkin genel bağıntıları belirtmeye çalışan bir bilimdir.  Çok sayıda dış etkene bağlı nesne, varlık ya da olayların sayısal dökümü yapılabilen özelliklerini, incelemeye yarayan bir teknik ya da yöntem kümesidir.

37  Yığın olayların belli amaçlarla gözlemlenmesi sonucu elde edilen verilerin sayısal biçimde işlenmesini sağlayarak, söz konusu olayların oluşturduğu yığınların bilimsel bir şekilde incelenmesinde kullanılan teknik ve yöntemler bilimidir.  Çağdaş anlamda istatistik kısaca “Bilimsel karar ile bilimsel eyleme ışık tutan teknik” diye tanımlanabilir.

38 1.3. İSTATİSTİK SÖZCÜĞÜNÜN KÖKENİ “İstatistik” sözcüğünün İtalyancada devlet adamı anlamına gelen “statista”dan alındığı ifade edildiği gibi, Latincede durum anlamına gelen “status” kökünden türetildiğine inanılmaktadır. Yunancada gözlem için kullanılan “startizein” sözcüğünden kaynaklandığı inancında olanların yanında İtalya’da devletin siyasal durumu anlamındaki “stato” kökünden kaynaklandığı görüşünde olanlar da vardır.

39 “İstatistik” sözcüğüyle ilgili olarak kesin bilinen, Alman bilimcilerin 18.yüzyıl başlarında devletin durumuyla ilgili sayısal bilgiler için ilk kez “Statistik” deyimini kullanmış olmalarıdır. Türkiye’de Cumhuriyet döneminde yerleşmiş olan istatistik sözcüğüne karşılık olarak, Osmanlı İmparatorluğunda “ihsaiyat” deyimi kullanılmıştır.

40 1.4.İSTATİSTİK KURAMININ GELİŞMESİ 17.yüzyıl ortalarında Alman Üniversitelerinde okutulan “Devlet Bilgisi” dersi ile başlangıç böylece devlet “status” sözcüğünden türeyen “istatistik” sözcüğünün ortaya çıkışı sayılara dayanmadan devletin betimlenmesi üzerinde duran bu okulun önde gelenleri Con ring, Archenwell, Schmeitzelldir.

41 Daha sonra İngiltere’de ve Almanya’da ortaya çıkan “Sigorta Matematikçileri Okulu” önde gelenleri Graunt, Pethy, Halley olan bu okul, doğum, ölüm gibi nüfus olaylarını sayısal verilere dayanarak çözümler. Kökeni Pascal’da,Galileo’da aransa da ”Büyük Sayılar Kanunu “ile gerçek öncülüğü Bernouilli’nin yaptığı olasılık hesabını geliştiren okul Bernouilli’yi de Moivre izler.

42 Bu okulların düşüncelerini birleştirerek tümdengelimci istatistiğe, tümevarımcı istatistiği katarak çözümlemeye ağırlık veren okul ve temelini atan Quetelet’dir. Ardından Galton, Pearson, Spearmann, Fisher ve daha inceleri gelir. Son olarak bu okullara başta Benzerci olmak üzere çok değişkenli çözümlemede betimsel istatistiğe yeni boyutlar kazandıran Fransız okulu da eklenebilir.

43 1.5.İSTATİSTİK ARAŞTIRMANIN AMACI Rastlantıyı göz önünde tutarak olayları belirleyen genel yasaları, genel eğilimi ortaya çıkarmak, ana nedenleri aramak, olaylar arasındaki ilişkileri bağlantıları bulmak, böylece türlü yönetim, bilim ve teknik dallarında yapılacak kestirimlere, öngörülere, alınacak kararlara, girişilecek eylemlere yardımcı olmaktır.

44 1.6.GÜNÜMÜZDE İSTATİSTİĞİN ÖNEMİ Günümüzde hükümetler politikalarını formüle etmek ve aldıkları kararları desteklemek, politikacılarda halkı ikna etmek için istatistikleri temel almaktadır. Tıbbı araştırmalarda hastaların teşhisinde ve yeni ilaçların yan etkilerinin ortaya konulmasında istatiksel teknikler kullanılmaktadır.

45 Ekonomi, işletme ve kamu yönetiminde istatistiğin kullanılması son yarım yüzyıl içinde olağanüstü bir gelişme göstermiştir. İstatiksel yöntem sosyal bilimlerin bütün dallarında hemen hemen tek pratik çalışma aracı durumundadır.

46 2.İSTATİSTİK TABLOLAR

47 2.1.TABLO TİPLERİ

48 Verilerin istifadeye sunulmasında kullanılan çeşitli istatistik tablolar; genel tablolar ve analiz tabloları olmak üzere ikiye ayrılmaktadır. Genel tablolar, olay hakkında ayrıntılı ve tasviri bilgiler için düzenlenen tablolardır. Analiz tablolarında olay hakkında özet bilgilere yer verilerek önemsiz veriler ihmal edilir.

49 İstatistik tablolarda veriler belli bir sıraya göre yer alır. Verilerin sıralanması ihtiyaca göre şekil alır. Verilerin özel bir sıraya konması incelemeyi kolaylaştırır. Verilerin sayısı ne kadar çok olursa olsun tablo halinde istifadeye sunulmasında bir güçlük ortaya çıkarmaz. Bundan başka, çok sayıda dizilerin mukayesesi ancak tablo ile mümkündür.

50 2.2.TABLONUN KISIMLARI Birbirlerinden farklı çeşitli istatistik tablolar bulunmakla beraber bütün tablolarda şu kısımlar mutlaka yer alır: 1. Tablonun adı, 2. Başlık, 3. Ön sütun, 4. Gövde.

51 2.2.1.TABLONUN ADI Tablonun adı, tablodaki verilerin niteliğini, nereye ve ne zamana ilişkin olduğunu açıklamalıdır. Ancak, ad için çok uzun ifadelere kaçılması doğru olmaz. Gerekirse açıklıktan biraz fedakarlık yapılarak çok uzun olmayan bir ifade tercih edilir.

52 2.2.2.BAŞLIK Sütunlardaki maddelerin ve verilerin niteliğini gösterir, ifadelerdir. Başlığa, sütun adı da diyebiliriz.

53 2.2.3.ÖN SÜTUN Tablonun en solundaki sütununa ön sütun denir. Ön sütunda, belli bir sıra altında maddeler veya vasıflara ilişkin sınıflar yer alır.

54 2.2.4.GÖVDE Tablonun başlık ile ön sütunu tarafından çevrelenen kısmıdır. Gövde verilerin yer aldığı ve satır sayısı ile sütun sayısının bir eksiğinin çarpımı kadar verinin yazılabileceği yer bulunan kısmıdır. Bunlardan bazılarının boş kalması veya hepsinin dolu olması mümkündür.

55 2.3. TABLO DÜZENLENİRKEN GÖZ ÖNÜNDE TUTULMASI GEREKEN BAZI NOKTALAR Bir istatistik tablosu düzenlenirken aşağıdaki noktaların göz önünde tutulması faydalı olur:

56 BASİTLİK İstatistik tablolar basit olmalıdır. Basit tablo, ön sütun ve başlıkta yalnız bir vasfın sınıflarının yer aldığı tablodur. 1 sayılı tablo basit ve 2 sayılı tablo ise bileşik bir tabloya örnek olabilir. Özellikle istatistik bilgisi sınırlı olan kimselerin yararlanması için düzenlenen tablolarda basitlik önemle ele alınacak bir noktadır. Karışık tablolara gidildikçe gereken faydanın sağlanması güçleşir.

57 2.3.2.KAYNAK Kitap broşür ve diğer benzeri yayınlardaki istatistik tablolarda yer alan veriler, çok kez, yayımı yapanın uyguladığı bir metotla elde ettiği bilgiler değildir. Başka kurumların elde ettiği veriler aynen bazı işlemlere tabi tutularak alınabilir. Bu gibi hallerde verilerin kaynağı hakkında açık bilgi verilmelidir.

58 Çünkü, bu verileri kullanacak olanlar onların ne çeşit bir metotla elde edildiği, doğruluk dereceleri, kavramlar için kullanılan tarif ve açıklamalar ve benzeri diğer hususlar hakkında bazı bilgilere ihtiyaç duyabilirler. Bu gibi hususlar hakkında yeterli bilgi edinmeden verilerden gerektiği şekilde faydalanmak mümkün olmaz.

59 Bunun için, kaynakla ilgili olarak, yayımı yapanın adı, yayının adı, aktarılan verilerin bulunduğu sayfa numarası veya tablo numarası, yayım yeri ve tarihi açıklanır.Kaynak hakkında verilen açıklama, kısa olmak şartıyla, tablonun adının altına yazılır. Açıklama uzun olduğu takdirde dipnot yerine veya tablonun uygun bir aşka yerine yazılır.

60 TABLONUN ŞEKİL VE BÜYÜKLÜĞÜ Bir istatistik tablosunun şekli ve büyüklüğü şu faktörlere göre belirir: Tablonun yer alacağı yayının sayfa büyüklüğü. Bir tablonun şekli ve büyüklüğü, her şeyden önce, yer alacağı yayına uygun olmalıdır.

61 Sütun sayısı ve genişlikleri. Tablonun genişliği sütun sayısı ve genişlikleri ile belirir. Geniş tablolar, incelemeyi zorlaştırdığı için, tercih edilmemelidir. Özellikle satır aralıları küçük olan geniş tablolarda sağdaki sütunlarda yer alan bir verinin hangi sınıf veya maddeye ilişkin olduğunun anlaşılması zorlaşır.

62 Geniş bir tablo düzenlemek zorunda kalındığı takdirde ön sütundaki maddelerin,aynı sıraya göre son sütunda da gösterilmesi incelemeyi kolaylaştırır. Bazı hallerde verilerin bin veya milyon olarak alınması, ihtiyacın karşılanması bakımından, sakıncalı sayılmaz. Böylelikle tablo genişliğinden önemli bir tasarruf sağlanır.

63 Satır sayısı. Bir tablonun uzunluğu, ön sütunda yer alan madde veya değer sınıfı sayısına göre belirir. Madde veya sınıf sayısı, bazı hallerde, bir sayfaya sığmayacak kadar çok olabilir. Bu taktirde tablo birden fazla sayfa kapsar. Tablonun boyunun uzaması veya birden fazla sayfa kapsaması genişliğinin artmasından daha az sakıncalıdır.

64 Bununla beraber tablonun mümkün olduğu kadar kısa olmasına çalışılır. Özellikle madde sayısı çok olan bir tabloda satır aralıkları dar tutulur. Ancak, sütun sayısı çoğaldıkça satır hizalarını seçmek zorlaşacağından her 5 veya 10 sık satırdan sonra satır aralığının genişletilmesi ile bu sakınca azaltılır. İstatistik tablolarda, satır çizgisi kullanılmaz, toplamlar iki çizgi arasında gösterilebilir.

65 2.3.4.TABLO NUMARASI Özellikle, bir yayında fazla sayıda tablo bulunursa bunlara bir sıra numarası verilmesi uygun olur. Aksi taktirde, metinde zaman zaman söz konusu edilecek tabloların uzun adlarının tekrarlanması zorunda kalınması, psikolojik yönden önemli bir sakıncadır.

66 2.3.5.KISALTMALAR VE DENDEN (“ ”) İŞARETLERİ Tablolarda kısaltmalardan kaçınılmalıdır. Tabloyu düzenleyen kimse için anlamı pek belli olan bir kısaltma, tablodan faydalanması beklenen kimselerden çoğunun anlayamadığı bir kısaltma niteliğinde olabilir. Aynı ifade veya verilerin alt alta gelmesi halinde(“ “)işaretleri kullanılamayıp ifade veya veriler aynen tekrarlanarak yanlış anlamlara yol açılması önlenir.

67 2.3.6.ÖNEMLİ MADDELERİN BELİRLENMESİ Özellikle analiz tablolarında, önemli verilerin göze çarpacak şekilde gösterilmesi uygun olur. Bunun için aşağıdaki iki yoldan faydalanılır: Önemli sayılan verilere gövdenin sol ve üst tarafında yer verilir. Toplamlar önemli sayılıyorsa birinci satıra yazılır.

68 Önemli sayılan veriler diğerlerinden daha koyu mürekkeple yazılmak suretiyle göze çarptırılır. Mümkün olduğu takdirde değişik renklerden de faydalanılabilir.

69 2.3.7.MUKAYESE KOLAYLIĞI Tabloda birbirleriyle mukayese edilecek veriler bulunduğu taktirde verilerin bu işi kolaylaştıracak şekilde tabloda yer alması gerekir. Bu bakımdan, aşağıdaki hususlara dikkat edilmesi faydalı olur:  Alt alta olan verilerin mukayesesi, yan yana olanlarınkinden daha kolaydır.

70  İki veya daha fazla dizinin mukayesesi yan yana gelen sütunlarda daha kolay olur. Dizilerin alt alta satırlar şeklinde bulunması mukayeseyi zorlaştırır.  İster aynı satırda, ister aynı sütunda bulunsun, mukayese edilecek veriler bir birinden uzaklaştıkça mukayese zorlaşır.

71 2.3.8.ÖLÇÜ BİRİMLERİ Bir tablodaki bütün veriler aynı ölçü birimi ile ölçülen değerler niteliğinde iseler ölçü birimi, başlıklar üst çizgisinin üzerinde uygun bir yerde açıklanır. Bir sütundaki veriler aynı ölçü birimini haiz, fakat sütundan sütuna ölçü birimi değişiyorsa ölçü biriminin niteliği başlıkta açıklanır.

72 2.3.9.VERİLERİN YUVARLAKLAŞTIRILMASI Orijinal veriler çok büyük, fakat ihtiyaç bakımından birler basamağına kadar gösterilmesi lüzumsuz ise veriler bin veya milyon olarak tabloya alınır. Gerçi bu ikisi arasında diğer yuvarlak değerler de (10, 100, 1000 gibi) seçilebilirse de uygulamalarda daha çok bin veya milyon tercih edilmektedir.

73 Verilerin bin veya milyon cinsinden anlaşılması 100, 1000 veya bir başka yuvarlak değer cinsinden anlaşılmasından daha kolaydır.Genellikle, yaklaşık değerler olduğundan bazı hallerde birler basamağına veya kesirlerine kadar gösterilmesi gülünç olur. Verilerin yuvarlaklaştırılması bazı hatalara yol açar.

74 Ancak her madde veya sınıf için yapılan pozitif veya negatif yöndeki hatalar kısmen bir birini yok edeceklerinden yuvarlak değerlerden hesaplanan toplam, ortalama ve benzeri diğer değerlerin hatası nispeten küçük olur. Genellikle, sınıf veya madde sayısı arttıkça verilerin yuvarlaklaştırılması ile bunlar dayanarak hesaplanan istatistiklerin bu yüzden taşıyacakları hata payı küçülür.

75 Bununla beraber, varsa toplam ortalama ve benzeri istatistiklerin orijinal veriler yuvarlaklaştırılırken 0,5 den büyük kesirler 1 birim sayılır ve 0,5 küçükler atılır. Tam 0,5 olan kesirli değerler için kesirden önceki rakam tek ise 1 birim çift ise sıfır birim kabul edilmek suretiyle hata azaltılır.

76 TABLOLARDA KULLANILAN İŞARETLER Tablolarda bazı ortak işaretler kullanılır. İşaretlerde uluslar arası bir uygulama için çalışılmaktadır. Bir çok kimseler buna uymakta iseler de ortak işaretler dikkate alınmadan düzenlenen bir çok tablolara da hala rastlanmaktadır.

77 Birleşmiş Milletler İstatistik Şubesi üye memleketlere, tablolarda çeşitli maksatlar için aşağıdaki işaretlerin kullanılmasını tavsiye etmektedir: (.) Söz konusu değil. Örneğin, yaşa göre medeni hale ilişkin tablolarda evlenme çağının altındaki nüfus için (.) işareti kullanılır. (...) Veriler elde edilmedi.

78 ( -) Madde veya sınıfın değeri sıfır. (0,0) Değer, kullanılan birimin yarısından küçük. Bütün istatistik tablolarda aynı kavram için aynı işaretlerin kullanılması ile tablolardan daha kolay yararlanma imkanı sağlanır. İşaretlerin ne anlamda kullanıldığının, yayının uygun bir yerinden açıklanması gerekir

79 2.4.VERİLERİN SIRALANMASI Tablolarda, verilerin bazı esaslara göre bir düzen altında yer aldığına işaret etmiştik. Veriler için uygulanan bir çok sıralama şekilleri vardır. İhtiyacı en iyi karşılayan veya olayın niteliğine en uygun sıralama seçilir.

80 2.4.1.BÜYÜKLÜK İncelemeyi kolaylaştırmak için, çok kez, kantatif vasıflar ilişkin bireysel değerler küçükten büyüğe veya büyükten küçüğe doğru sıraya konarak bir sıralı dizi haline getirilir. Veya çokluk bölünürlerinde belli değer sınıflarına göre gruplara ayrılır.

81 Bunun sonucu olarak veriler küçükten büyüğe veya büyükten küçüğe doğru değer sınıflarına göre sıralanmış olur. En çok analiz tablolarında kullanılan bu sıralama şekli olayın zaman içindeki akımının önemli sayıldığı hallerde uygulanamaz.

82 2.5. İSTATİSTİĞİN FAYDALARI İstatistik metotlarının iki fonksiyonu vardır: Birincisi Bilim adamına, bulgularını bildirirken yardımcı olmak. İkincisi Bilim adamının verilerin ötesinde daha genel sonuçlara gitmesine yardımcı olmak.

83 3.İSTATİSTİĞİN UYGULAMA ALANLARI

84 Çağımızda sayısal bilgi toplanabilen her araştırma alanında istatistik yöntemler kullanılır:Toplumsal olayların gelişimi, davranış psikolojisi, otomatik üretim süreçleri, bilgisayarlar gibi büyük teknik sistemlerinin yönetimi, jeolojik süreçler, gazlardaki karmaşık olgular, sinir sisteminin işlevleri ve yönlendirici çalışmaları istatistik yöntemlere başvurulmadan incelenemezler.

85 Biyoloji,antropoloji, sosyoloji, psikoloji, iktisat, işletme, tıp, kuantum fiziği, biyolojik vb.... özetle tüm bilim dalları, yöntem kuruluşları, teknoloji, iş ve piyasa araştırmalarında istatistikten yararlanılır.

86 3.1.KAMU HİZMETLERİNİN GÖRÜLMESİNDE İSTATİSTİĞİN ROLÜ Mesela; Milli Eğitim politikasının gerektirdiği şekilde planlanıp en yararlı bir şekilde uygulanabilmesi için gelecek yıllarda ilk, orta ve yüksek tahsil çağında bulunan kimselerin sayılarının bilinmesinin, bunlara tahsil imkanı sağlanabilmesi için ne kadar öğretmene, okula ve eğitim-öğretim araçlarına ihtiyaç olduğunun belirlenmesinde kullanılır.

87 3.2. BİLİMSEL ARAŞTIRMLARDA İSTATİSTİĞİN ROLÜ Bilimsel araştırmalarda istatistik önemli bir rol oynamaktadır. Özellikle, deneysel araştırmalarda, bir hipotezin kabule değer olup olmadığının belirtilmesi ve araştırma sonuçlarının objektif olarak yorumu ancak modern istatistik metotlarına dayanmak suretiyle mümkündür. İst. Metoduna dayanmayan araştırmalar ve bunlarla ulaşılan sonuçlar bilimsel sayılmamaktadır

88 3.3.PSİKOLOJİDE İSTATİSTİK

89 İstatistik teorisi uygulamalı matematiğin bir parçasıdır. O halde istatistik teorisi, psikoloji disiplininin içinde değildir. Bununla birlikte, modern psikolog, istatistik teorisinin hiç değilse temel bilgilerini bilmeyi faydalı bulur. İstatistik öğrenme, psikoloji alanında yetişmenin vazgeçilmez bir parçasıdır.

90 İstatistik teorisi, modern psikoloji araştırmalarıyla şöyle bir tanışıklık isteyen için bile faydalıdır. Psikolojide, başkalarının araştırmalarını anlamak ve değerlendirmek açısından olduğu kadar, kendi araştırma bulgularının sonuçlarını bildirmek ve yorumlamak açısından da istatistik bilmek önemlidir.

91 3.4.BETİMSEL İSTATİSTİK Sokaktaki adam bir istatistikten söz ederken, bir durumu betimleyen bir sayıyı kasteder. İstanbul’da bir günde meydana gelen trafik kazalarının ortalama sayısı işte bu anlamda bir istatistiktir. Mart 1990’da Türk Ordusundaki asker sayısı bir başka istatistiktir. Bir istatistik şu veya bu şeyin sayısal durumunu betimler.

92 İstatistik teorisinin büyük ve önemli bir kısmı, sayısal veri topluluklarını betimlemekle uğraşır. En faydalı olmak ve en kolay bildirilmek için, bir veri topluluğunun toparlanması ve özetleme biçimleridir. Betimsel istatistik teorisi,verileri betimlenin çeşitli biçimlerindeki bilgi ile ve verileri çeşitli biçimlerde sunmanın göreceli verimliliği ile uğraşır.

93 Örneğin, bir psikolog, bir grup spor yapan erkek lise öğrencisinin ve bir grup spor yapmayan erkek lise öğrencisinin mesleki amaç ve ilgilerini karşılaştırmak isteyebilir. Bununla ilişkili verileri toplayınca, iki grubun her birini nasıl betimleyeceğine karar vermelidir. Çok büyük miktarda potansiyel bilgi, grupların bir bütün kavranabilir birkaç özelliği içine sıkıştırılmak zorundadır.

94 Ondan sonra, psikolog, grupların nasıl karşılaştırılacağı meselesiyle uğraşmalıdır. Karşılaştırmanın esası ne olacaktır? Eğer gruplar arasında farklar varsa, bu farklar en açık bir şekilde nasıl gösterilecektir? Gruplar arasında şu veya bu tarzda sayısal karşılaştırmalar yapılmalı mı? Veriler grafikle mi en iyi sunulabilir?

95 Spor yapan bir erkek lise öğrencisinin tipik ilgi örgüsü bulunabilir ve spor yapmayan tipik bir erkek lise öğrencisinin farklılığı gösterilebilir mi? Bütün bu sorular betimsel istatistik göstergelerinin seçilmesi ve kullanılması ile ilgili sorulardır. Bundan sonraki iki bölümde esas itibarıyla, en çok kullanılan betimsel istatistik göstergelerle uğraşacağız.

96 Verilerin hem grafik hem sayısal özetlenmeleri üzerinde duracağız. Ancak şunu da eklemek gerekir ki bu metotlar, başvurulması mümkün betimsel tekniklerden seçilmiş sadece birkaç tanesidir;verilerin farklı amaçlarla toparlanması ve bildirilmesi için çok çeşitli istatistik teknikler geliştirilmiştir.

97 Burada ana çizgileriyle verilen teknikler, sırf çok karşılaşıldıkları için değil, aynı zamanda, daha genel matematiksel istatistik teorisinde merkezi roller oynadıkları için seçilmiştir.

98 3.5.MUHAKEME İSTATİSTİĞİ Betimsel istatistiğin incelenmesi, veriler hakkında bildirimde bulunmak için bir dil kazandırır. Betimsel istatistik daima, bir deneyicinin topladığı belirli veri topluluğu ile uğraşır. Betimsel istatistiği kullanmada deneycinin görevi, o verilerin gösterdiği şeyi yakalamak ve bildirmektir.

99 Bunu yapınca deneycinin ilgisi sona ermez. Bir bilim adamı olarak deneyci, doğadaki ve davranıştaki düzenlilikleri bulmaya ilgi duyar. Bu düzenliliklerden genel prensiplere- bundan sonraki gözlemlerin sonucunu önceden kestirmeye imkan veren prensiplere- ulaşmayı ümit eder.

100 Bilim adamı, koşulan şartların var olduğu her zaman geçerli olması beklenebilecek genel ilişkileri arar. Bu ilişkiler, etrafımızdaki dünya gözlenerek keşfedilir ve doğrulanır. Öte yandan, hiçbir ölümlü bilim adamı, genel bir sonuç çıkarmak istediği olayların hepsini asla gözleyemez. Genel sonuca, sınırlı sayıda gözlemlere dayanarak varmak zorundadır.

101 Bilim adamı, gözlediği özel şeylerden genel bir sonuca ilerler. Özelden genele gitme süreci tümevarım olarak bilinir. İşaret etmek gerekir ki özel gözlemlerden genelleme süreci çok riskli olabilir. Bilim adamının yaptığı her bir gözlem, bilim adamına, o tür gözlemlerin hepsini yapabildiği takdirde elde edeceği izlenimlerden farklı bir izlenim verebilir.

102 Ancak sınırlı sayıda gözlemler yapma zorunluluğu ile yüz yüze kalan bilim adamı, gerçek veya uzun vadedeki durumun niteliği hakkında ancak bir tahmin olarak genel sonuçlara varabilir. Gözlemlerine dayanarak bir çeşit genel sonuca ulaşabildiği zaman bile bilim adamı,haklı olduğundan emin değildir, şu veya bu derecede kayıtsızlık duyar.

103 İste bu noktada istatistik, bilim adamının çalışmasına değerli ve enteresan katkılarından birini yapar. Muhakeme istatistiği teorisi, özel kanıtlardan genel sonuçlara varmak için metotlar sağlar. Bu teori, bilim adamlarına, belirli bir veri topluluğuna dayanarak ne gibi kararlar vermesi gerektiğini söylemez. Ama sonuçlara ulaşmada işe yarar yolların seçimi hususunda deneyciye rehberlik eder.

104 Bunun da ötesinde, istatistik teorisi, olasılık teorisinden yararlanarak bilim adamına, bir veri topluluğundan belirli bir sonuca varırken girdiği riski hesaplama imkanını verir.Her ne kadar bu kitapta, muhakeme istatistiği teorisine ancak kısaca değinilecekse de, öğrenci istatistik tahminler yapma yolları hakkında bir miktar bilgi edinecektir.

105 Bu bilgiyi edinebilmek için öğrencinin, basit şekliyle olasılık teorisiyle biraz tanışıklığı olmalıdır. Bunun için, kitabın 4. bölümü öğrenciyi temel olasılık kavramlarıyla tanıştırmak için düzenlenmiştir. Bu kavramlar, sonraki bölümlerde tartışılan muhakeme metotlarının temelini oluşturacaktır.

106 3.6.İSTATİSTİĞİN FAYDALARI

107 İstatistik metotların, psikologun çalışmasına sadece bir ilaveden başka bir şey olamadığını, psikoloji öğrencisi daha ilk baştan anlamalıdır. Yukarıda söylendiği gibi, istatistik metotların iki fonksiyonu vardır: Birincisi, bilim adamına, bulgularını bildirirken yardımcı olmak.

108 İkincisi, bilim adamının verilerin ötesinde daha genel sonuçlara gitmesine yardımcı olmak. Böyle olmakla birlikte, yaptığı deneyin ve topladığı verilerin gerçek değerinin, bilim adamının kullandığı istatistik aletlerle hiç bir ilgisi yoktur. Bir istatistik metodun uygulanması, fena bir deneyi iyi bir deneye dönüştüremez.

109 Şunun ve şunun doğru olduğuna verilerin bizi inandırma gücü, deneyin kritik bir tarzda düzenlenmiş olmasından ve bir bütün olarak mantığından ileri gelmez. Araştırmaya yeni başlayanların bunu hatırdan çıkarmaması özellikle önemlidir.

110 Öte yandan, iyi tasarlanmış ve yapılmış bir deneyde istatistik Metotlar, deneyin anlamını açıklığa kavuşturmada ve varılan sonuçların genelleştirmeye elverişli olduğunu göstermede son derece yardımcı olabilir. İstatistiğin uygulamaları bütün araştırma alanlarında, fizik bilimlerde, biyolojik bilimlerde, mühendislikte, iş ve piyasa araştırmalarında ve başka alanlarda görülür.

111 Farklı alanlarda fiilen kullanılan metotlar farklılıklar gösterse de, bu metotların hepsi aynı temel istatistik teorisine dayanır. Bundan sonraki bölümlerde birtakım istatistik metotlar ana çizgileriyle verilecektir. Bu metotlar iki anlamda temeldir.

112 4.İSTATİSTİĞİN BÖLÜMLERİ A. Tanımlayıcı istatistik B. Analizci istatistik

113 4.1. TANIMLAYICI İSTATİSTİK Bilimsel araştırmalarda toplanan veriler genellikle düzensiz bir durumda bulunur. İncelenen vasıflar açısından hedef kitlenin yapısını ortaya çıkarabilmek için ham veri adı verilen bu bilgilerin işlenmesi gerekir.

114 Veri işlenmesinde ise sınıflama, gruplama, vasıf kombinezonu teknikleri ile toplam (sayı ya da frekanslar), oran (yüzdeler), ortalama (aritmetik ortalama, mod, medyan) ve standart sapma gibi ölçütlerden yararlanılır.

115 Frekans dağılımı Merkezi eğilim Merkezi dağılım Çarpıklık

116 4.1.1.SINIFLAMA “Sınıflama incelenen vasfın aynı şıkkına sahip birimlerin kümler halinde ayrılması şeklinde tanımlanabilir. Sınıflama sonucunda elde edilen her bir şıkkın tekrarlanma sayısı ise “frekans” olarak adlandırılır. Örneğin bir okuldaki öğretmenler cinsiyetlerine göre sınıflandırıldıklarında erkek ve kadın öğretmen miktarları her bir şıkkın frekansını verecektir.

117 Sınıflama basit bir işlem olarak görülmekle birlikte, konu ile ilgili ilk sorun ücret, meslek, doğum yeri gibi vasıfların şıklarının on binleri bulmasıdır. Ancak bu tür vasıflar için tüm şıkların ifade edildiği durumlarda dahi kitlenin kavranması ve elde edilen sonuçların sağlıklı olarak yorumlanması mümkün olmaz. Bunun için gruplama yöntemine başvurulur.

118 4.1.2.GRUPLAMA Gruplama bir vasfın homojen şıklarının bir araya getirilmesi işlemidir. Örneğin doğum yerlerinin düzenlenmesinde şıkların il ya da bölge bazında bir araya getirilmesi ya da gelir düzeyinin, Geliri yok, 1000 YTL’den az, YTL, YTL, 3001 YTL ve yukarısı şeklinde gelir aralığı gruplarına ayrılması gruplamaya örnek olarak verilebilir.

119 Gruplama ile çok şıklı vasıfların şık sayısı azaltılarak kavranamayacak derecede uzun tablolar anlaşılır hale getirilir. Ancak grupların fazla büyütülmesinde bazı sakıncalar ortaya çıkabilir. Grupların homojen olmama tehlikesi bu sakıncalardan en önemlisidir. Örneğin 0-9 yaş gurubu ölümler hakkındaki bir araştırma için homojen değildir.

120 Çünkü yeni doğmuş çocukların ölüm oranı diğerlerinin, özellikle 5-9 yaş arasının ölüm oranından kat kat yüksektir. Ayrıca bazı durumlarda sınıflamanın birden fazla vasfın şıklarına göre yapılması gerekebilir. Örneğin erkek ve kadınların ücretlerinin saptanması, sadece cinsiyet ve ücret vasıflarının ayrı ayrı sınıflanması ile mümkün olmaz.

121 4.1.3.SERİLER Gözlem sonuçlarının zaman ve mekan vasıfları ile belirli bir vasfın şıklarına göre sıralanmış olarak gösteren sayı dizileridir. Seriler sayılan özelliklerine göre “zaman serileri”, “mekan serileri”, “bölünme serileri” ve “bileşik seriler” olmak üzere dört başlık altında incelenebilirler.

122 Gözlem sonuçlarının zaman vasfının şıklarına göre sıralanmış şekline “zaman serisi” denir. Aylara göre üretim miktarları, yıllara göre enflasyon rakamları zaman serisine örnek olarak gösterilebilir. Gözlem sonuçlarının mekân vasfının şıklarına göre sıralanmış şekline “mekân serisi” denir. Bölgelere göre üretim miktarı, illere göre ortalama gelir düzeyleri mekân serisine örnek olarak verilebilir.

123 Bir kitlenin belirli bir vasfın şıklarına göre sıralanmış şekline ise “bölünme serisi” ya da “frekans bölünmesi” denir. “Bileşik serilerin” temel özelliği ise gözlem sonuçlarının iki ya da daha fazla vasfa göre bir arada gösterilmesidir.

124 4.1.4.FREKANS VE YÜZDE Frekans (f) kaç insanın belli bir kategoriye uyan (örnek: sigara içmeyen 32 kişi; 45 yaşının üstünde 20 kişi) ya da belli bir seçeneği tercih eden kişilerin sayısını göstermek için kullanılır. Yüzde ise belli bir kategoriye ait frekansın toplam frekansa oranıdır.

125 4.1.5.ARİTMETİK ORTALAMA Aritmetik ortalama, birimlerin toplanması ve elde edilen sonucun toplam birim sayısına bölünmesi ile bulunur.

126 4.1.6.MEDYAN Medyan bir ölçeğin orta noktasıdır. Medyanın üzerinde ve altında eşit miktarda değer bulunur. %50 oranı medyanın diğer bir ifade şeklidir. Özellikle grup üyelerinin büyük bir çoğunluğu benzer özellikler gösteriyor, bazıları ise çok farklı özellikler taşıyorsa kullanılabilecek en uygun teknik medyandır.

127 4.1.7.MOD Mod bir dizideki diğer değerlerden daha yüksek frekansa sahip değerdir.

128 4.1.8.STANDART SAPMA Aritmetik ortalamayı kullandığınızda tüm değerleri hesaba katarsınız. Eğer bir iki adet çok yüksek ya da düşük değer söz konusu ise, ortalama suni olarak düşüş ya da artış gösterebilir. Bu gibi durumlarda medyan yardımcı olmakla birlikte, yine de sizi yanlış yönlendirebilir.

129 4.2.ANALİZCİ İSTATİSTİK Araştırma yöntemlerinde, analiz amacına göre sınıflandırma çerçevesinde, yaygın olarak kullanılan çeşitli istatistiksel analiz tekniklerinin amacı, uygulanabilme şartları, varsayımları ve sonuçlarının yorumlanması, gruplar arası farklılıkları ve ilişkileri incelemede yaygın kullanım alanı bulan çeşitli istatistiksel analiz teknikleri uygulanmaktadır.

130 Farklılıkların incelenmesine yönelik teknikler üç genel kategori altında toplanır. Birinci grup teknikler, araştırma yapılan herhangi bir konuda, ölçülen (gözlemlenen) değer ile beklenen (öngörülen) değer arasında bir farkın olup olmadığının incelenmesine yönelik analiz teknikleridir. İkinci grup analiz teknikleri, iki grup arasındaki farklılıkları incelemeye yönelik testlerdir.

131 Bunlardan birincisi birbirinden bağımsız iki grup arasındaki farklılıkların incelenmesine yçnelik analiz tekniği olup, bağımsız iki grup (örnek) t- testi olarak bilinmektedir. Diğeri ise birbiriyle alakalı (ilişkili) iki grup arasındaki farklılıkları araştıran analiz teknikleridir.

132 Son grup teknikleri ise ikiden fazla grup arasında karşılaştırmaların yapıldığı veya faklılıkların incelenmesine yönelik olan analiz teknikleri olup, ANOVA, Oneway ANOVA veya ki- kare teknikleridir. Gruplar arası farklılıkları incelemeye yönelik parametrik analiz teknikleri ve parametrik olmayan analiz teknikleri olmak üzere iki grup testten oluşur.

133 Örnekleme teorisi Hipotez tezleri Reglasyon Korelasyon

134 4.3.ÖRNEK VE ANA KÜTLE

135 Yapılan bir istatistiki araştırmada konu teşkil eden tüm birimlere ana kütle denir. İlgili araştırmada gözlem bilgilerinin hepsini toplayarak bir araya getirip bütünleştirmek her zaman mümkün olmayabilir.

136 Genelde yapılan araştırmada gözlemlerin hepsi yerine belli bir kesim ile sonuca gidilmeye çalışılır.İşte ana kütlede ulaştığımız bu belli kesime örnek denir.Daha pekiştirecek olursak bir okulda işletme bölümü için yapılacak bir araştırmada tüm okul öğrencileri ana kütleyi oluştururken işletme bölümündeki öğrenci grubu örnek olacaktır.

137 4.4. PARMETRİK ANALİZ TEKNİKLRİ

138 4.4.1.T-TESTİ T-testi sosyal bilimlerin bir çok alanında yaygın olarak kullanılan testlerden biridir. T-testi örnek boyutunun küçük olduğu ve evrene ait standart sapmaların bilinemediği durumlarda t- dağılımını kullanarak tek veya iki grup arasında farkın olup olmadığını tespite yönelik bir tek değişkenli hipotez testidir.

139 T dağılımı, özellikle örnek boyutu 30’un altında olduğunda yararlı olan simetrik yapılı çan eğrisi şeklindedir. T- dağılımı normal dağılıma çok benzemektedir. Örnek boyutu büyüdükçe t- dağılımı normal dağılıma daha çok benzemeye başlar ve örnek boyutu 100’ün üzerine çıktığında ikisi arasındaki farkı görmek zorlaşmaktadır.

140 Genel olarak üç farklı t-testi uygulanmaktadır. Bunlar; (1) tek grup t-testi, (2) bağımsız iki grup arası farkların testi, (3) bağımlı iki grup arası farkların testine yönelik t-testleridir.

141 TEK-GRUP T-TESTİ Örneğin araştırma yöntemleri hocası geçmiş tecrübelerine dayanarak söz konusu dersin not ortalamasının 55’ten yukarı olmadığını öne sürmesi buna ait bir örnektir. Başka bir örnekte ise bir cafe yöneticisi günlük ortalama 250 çay satışı yaptığını iddia etmektedir.

142 Bu örneklerde olduğu gibi üzerinde inceleme yapılan konuya ilişkin gözlemlenen değerlerin beklene veya olması gereken standart değerden farklı olup olmadığının incelenmesi durumunda kullanılan analiz tekniği olup, buna tek grup t-testi adı verilmektedir.

143 Yöneticiler ve araştırmacılar çoğunlukla belli konularda çeşitli ifadeler kullanmak isteyebilirler. Buna örnek olarak “ yeni sürülecek bu ürünün Pazar payı %15’i aşacak “, “ yeni ambalaj tüketicilerin en az %65’inden fazlasınca beğenilecek “, “ bayilerin %80’i yeni fiyatlandırma politikasını tercih edecekler” ve

144 “ işletmemizde günlük hatalı üretim 20 adedi geçmemektedir” ifadeleri verilebilir. Bu ifadeler Null (istatistik) hipotezi şekline çevrilerek uygun güven seviyesi için tek- örnek (grup ) t-testi analizine tabi tutulabilir.

145 İKİ BAĞIMSIZ GRUP ARASI FARKLARIN TESTİ Sosyal bilimlerin bir çok alanında farklı evrenlerden gelen kişiler arasında karşılaştırmalar yapılmaktadır. Örneğin, belirli bir markayı kullananlar ve kullanmayanların bu markaya karşı olan tutumlarında farklılık olup olmadığının tespit edilmesi.

146 Bayanlarla erkekler arasında kopya çekme eğilimi açısından bir farkın olup olmadığının incelenmesi gibi konular ikili karşılaştırmaları gerektirmektedir. T-testi sadece iki grup arasında karşılaştırma yapmaya imkan tanımaktadır. Burada karşılaştırılan iki grubun farklı evrenlerden(ana kütlelerden) tesadüfi olarak seçilmiş olması gerekmektedir.

147 Bir gruba ait ölçümlerin diğer gruba ait ölçümleri etkilemesinin mümkün olmadığı varsayılmaktadır.Bir grubun vereceği cevap,davranış şekli evrende bulunan diğer gruplar tarafından etkilenmemektedir ve gruplar kendine has özellikler sergilemektedirler. Bu test grup ortalamaları için uygulanabileceği gruplar arası oranlar için uygulanabilmektedir.

148 BAĞIMLI İKİ GRUP ARASINDAKİ FARKLARIN TESTİ Bağımsız iki grup t-testinde grup arası karşılaştırmada grupların birbirinden bağımsız evrelerden geldiği varsayımdan hareket edilmekte idi. Ancak, özellikle kontrollü veya deneysel çalışmalarda aynı denekler farklı durumlara şartlandırılarak değişik durumlar altında sergiledikleri davranışlar ve algılar inceleme yoluna gidilebilir.

149 Bu testin bir önceki t-testinden farkı üzerinde ölçüm yapılan veya cevaplayıcıların her iki durum altında da aynı kişiler olmasıdır. Başka bir ifade ile, grupları ilişkili yapan şey cevaplayıcıların veya deneklerin aynı kişiler olmasıdır.

150 Bu testin hesaplanmasında bir öncekinden farklı olarak öncelikle eleştirilmiş farklar oluşturulduktan sonra bu farklara ilişkin ortalama ve varyans bulunduktan sonra t değeri hesaplanır. SPSS ortamında ise diyalog kutusu açıldığında ekranın sol tarafında bulunan değişkenler listesinden çiftler oluşturularak

151 ekranın sağ tarafında yer alan paired variables kısmına aktarıldıktan sonra, hesaplamalar bilgisayarca yapılır. Analiz sonuçlarının yorumu ise tek grup t-testinin yorumuna benzemektedir.

152 ANOVA VE ONE-WAY ANOVA T-testi, sadece iki grup arasındaki farklılıkların incelenmesi için uygundur. Örneğin pazarlama müdürü mamullerinin kullanıcılarını az, orta ve yoğun kullanıcılar şeklinde sınıflandırılarak her bir grubun satın alma davranışlarını araştırmak ve üç grup tüketicinin mamule karşı tutumlarını incelemek istemektedir.

153 Bu gibi durumlarda uygun test ANOVA testidir. Ancak ANOVA testi sonuçları sadece karşılaştırma yapılan arasında herhangi bir farkın olup olmadığını göstermekle beraber, bu farklılığa sebep olan grubun hangi grup veya gruplardan kaynaklandığı konusunda herhangi bir bilgi vermemektedir. Bu amaçla, one-way ANOVA testi uygulamak daha uygun olmaktadır.

154 4.5.PARAMETRİK OLMAYAN ANALİZ TEKNİKLERİ Parametrik testlerin uygulanabilmesi için bazı şartların sağlanması gerekliydi. Örneğin, bir diyetisyen, reklamı yapılmakta plan iki farklı diyet metodu arasında zayıflatma etkinliği açısından bir farkın olup olmadığını araştırmaktadır.

155 Bu amaçla her iki diyet için5kg’lık bir zayıflama için gerekli süreyi ölçer. Ancak diyetisyen ölçüm neticesinde ortaya çıkan gerekli süre değerlerinin normal dağılımından uzak olduğunun farkına varır.

156 MANN WHITNEY U TESTİ Wilcoxon testi olarak da bilinen bu test t- testinin parametrik olmayan eş değeri olarak düşünülebilir. Bu test için veri dağılımı konusunda herhangi bir şart olmamakla birlikte, verini tesadüfi olarak toplanmış olması ve sıralı olması yeterlidir.

157 Analiz için verinin, aralık seviyesi olmasına gerek kalmaksızın, ordinal seviyede olması yeterli olmaktadır. Bu test ile bağımsız iki grubun aynı dağılımı sahip ana kitlelerden geldiği hipotezi test edilmektedir.Şatlar sağlandığı sürece Mann Whitney U testi yerine t-testinin uygulanması daha doğru olacaktır. Çünkü t-testi daha güçlüdür.

158 4.5.2.İŞARET TESTİ Bu test bağımlı gruplar arası farklılıkları ölçmeye yönelik olan t- testinin non-parametrik eşdeğeridir. Bu analiz ile, iki değişkenin dağılımları aynıdır hipotezi test edilmektedir. Bu test için herhangi bir veri dağılım şartı yoktur.

159 WILCOXON İŞARETLİ – SIRALAR TESTİ İşaret testi sadece çiftler arasındaki farklılığın yönüne bakmaktadır. Farklılığın büyüklüğü ile ilgilenmemektedir. Wilcoxon İşaretli Sıralar testinde ise farklılığın büyüklüğü de dikkate alınarak analiz yapılmaktadır.

160 4.5.4.WALD WOLFOVITZ SIRA (R UNS ) TESTİ Bu test tesadüfiliği ölçme testidir. Bu test verilen seri gözlemler içinde bir değerin daha sonraki gözlemleri etkileyip etkilemediğini incelemektedir. Eğer bir etkileme söz konusu değilse, gözlemlerin sıralamasının tesadüfi olduğuna karar verilir.

161 4.5.5.BİNOM TESTİ Binom dağılımına uyan verilerin, belirli bir sonucun gelme olasılığının önceden belirlenen bir değere eşit olup olmadığının testinde kullanılmaktadır. Gözlemlerin frekans dağılımı ile binom dağılımı altında beklene değerle karşılaştırmasını yapmaktadır.

162 KOLMOGOROV -SMIRNOV (K-S) TESTİ K-S testi tesadüfi olarak toplanmış olan bir örnek verinin belirli bir dağılıma uyup uymadığını incelemek için kullanılmaktadır. Prensip olarak bu test, örnek verinin kümülatif dağılım fonksiyonunun öne sürülen kümülatif dağılım fonksiyonuyla karşılaştırılması esasına dayanmaktadır.

163 Bu test yardımıyla bir örneklemden toplanan verilerin normal dağılım sergileyip sergilemediğini incelemek mümkündür.

164 4.5.7.TEK - GRUP KI – KARE TESTİ Bu test ile araştırılan olayla ilgili olarak gözlemlenen frekans değerinin belirli bir değerden farklı olup olmadığının incelenmesinde kullanılmaktadır. Bu analiz için tek şart, verini tesadüfi olarak toplanmış olması şartıdır.

165 FRIEDMAN TESTİ İki veya daha fazla sayıdaki ilişkili örnek kitleyi karşılaştırmada kullanılmaktadır. Eşleştirilmiş gruplar t- testine benzemektedir. Testin yegane şartı ise her bir denek için k sayıdaki değişkenin 1’den k ‘ya kadar sıralanmış olmasıdır. Frıedman testi de ki-kare dağılımına benzer bir dağılım sergilemektedir.

166 4.5.9.İKİ-GRUP MEDYAN TESTİ İki popülasyonun veya ana kitlenin aynı medyana sahip olup olmadıklarının testi için kullanılmaktadır. Analizin temelinde, her iki ana kitleye ait verilerin birleştirilerek genel bir medyan değerinin belirlenmesi ve ardından da medyan değerin altında ve üstünde kalan değerlerin oranlarının tespiti yapılmaktadır.

167 İKİ GRUP WALD WALFOVITZ TESTİ Bu test iki gruba ait örneklerin aynı dağılıma sahip ana kitlelerden gelip gelmediğinin testi için kullanılmaktadır.

168 İKİ GRUP KOLMOGOROV – SMİRNOV TESTİ Bu test iki örnek kitlenin aynı dağılıma sahip kitlelerden gelip gelmediğinin testi için kullanılmaktadır. İki grubun dağılımlarının karşılaştırılması esasına dayanılmaktadır.

169 K-GRUP MEDYAN TESTİ İki grup medyan testinin bir çeşit olup, üç ve daha fazla sayıdaki bağımsız örneğin medyan değerlerinin karşılaştırmasını yapmaktadır.

170 KRUSKAL - WALLİS TESTİ Bu test uygulama olarak Mann Whiyney U testine benzemektedir, ancak üç veya daha fazla grubun karşılaşmasında kullanılmaktadır. Bu testler,değişkenler ve gruplar arasındaki farklılıkların incelenmesine yönelik kullanılan istatistik analiz teknikleridir.

171 Analiz amacına göre sınıflandırma çerçevesinde ilişkilerin incelenmesine yönelik istatistik analiz teknikler de mevcuttur. Gruplar veya değişkenler arasındaki ilişkilerin incelendiği bu bölümde ki-kare analizi, korelasyon analiz ve regresyon analizleri üzerinde durulmaktadır.

172 Kİ-KARE TESTİ Ki-kare testi çeşitli araştırmalarda kullanılmaktadır. Uyumluluk seviyesi testi, ilişkilerin var olup olmadığının testi ve iki değişkenin birbirinden bağımsız olup olmadıklarının testi bunlardan bazılarıdır. Ki- kare testi sadece ilişkilerin tespitinde değil değişkenler arasındaki farklılıkların belirlenmesinde de kullanılmaktadır.

173 Ki-kare analizi frekans dağılımları üzerinden hesaplanmaktadır ve şekil itibariyle ki -kare dağılımı çarpık bir dağılım gösterir. Ki- kare testinde Null hipotezi Ho olarak değişkenler arasında ilişki yoktur varsayımı yapılmaktadır. Ki kare testi sistematik bir ilişkinin olup olmadığını belirlemeye yardımcı olur.

174 Ki-kare testi bir çapraz tabloda yer alan değişkenler arasındaki gözlenen istatistiksel olarak anlamlı olup olmadığını test etmek için kullanılır. Temel olarak ki-kare testinde yapılan şey gözlemlenen frekans değerleri ile beklenen frekans değerlerinin karşılaştırılmasından başka bir şey değildir.

175 Ki-kare testi değeri örnek boyutundan son derece etkilenmektedir. Bu sebeple farklı boyutlardaki örnekler arasında ve farklı serbestlik dereceleri arasında kıyaslama yapılmak istenildiğinde hatalı sonuçlar verebilmektedir. Bu sorunu gidermek amacıyla ki- kare testine bağımlı çeşitli istatistikler geliştirilmiştir.

176 Bunlardan bir tanesi, değişkenler arasındaki ilişkilerin incelenmesinde kullanılan nominal ölçümler için geliştirilmiş olan fi katsayısıdır. Bu değer hesaplanan ki-kare değerinin örnek boyutuna bölünmesi neticesinde ortaya çıkan değerin kare kökünün alınması ile elde edilir ve 2x2 çapraz tablolara ait özel durum için kullanılır.

177 5.İSTATİSTİK BİLİMİNDE BAĞZI KAVRAMLAR  VERİ:Yapılan gözlemler sonucu ifade edilen sayısal ifadelere denir.  HAM VERİ: Herhangi bir işleme tabi tutulmamış verilere denir.  ÖLÇME:Sayısal sonuçlar elde edilmesi işlemine denir.  PARAMETRE:Ana kütle üzerinde bütün birimler üzerinden oluşturulan ölçütlere denir.

178  BİRİM:Ana kütleyi oluşturan sayısal ölçek ifade edebilen tüm ifadelerin her birine denir.  ÖRNEK:Belli bir özellik gösteren, birimleri içine alan kümeye denir.  ÖRNEKLEME:Örnek kümeyi oluşturmak için yapılan uygulamalara denir.

179 5.1. VERİLERİN TOPLANMASI Bir amaca yönelik belli bir istatistik yapabilmek için öncelikle materyal seçilmeli ve toplanmalıdır.Bu veriler çeşitli şekillerde elde edilebilir. Bunlar doğrudan elde edilebildiği gibi dolaylı olarak da erişilebilir.Örneğin doğan, ölen istatikler dolaylı verilerdir.

180 Kaynağa direk olarak ulaşıp veriler elde edilebiliyorsa bunlar doğrudan veriler olarak adlandırılabilir. Veriler anket, deney, araştırma, gözlem vb. gibi yöntemlerle elde edilebilir. Tabi bu verilere ulaşılırken zaman ve maliyet gibi konular göz önünde bulundurulması.

181 5.2.VERİLERİN TASNİF EDİLMESİ Verilerin anlamlı bir hale gelebilmesi için belirli bir tasnif işleminden geçmesi gerekir. Normalde bir veri tek başına anlam ifade edemezken, diğer veriler ile birlikte kullanılarak anlamlı bir hale getirilebilir ve diğer verilerle birleştirilerek bir bilgi şekline dönüştürülebilmektedir. Veriler değerlendirilirken de farklı bir araştırmaya tabi tutulabilir.

182 NOMİNAL ÖLÇEK Nominal ölçekte yapılan işlem özelliğin olup olmamasına göre kategorilere ayrılır. Örneğin bir ankette hayatımızdan memnun musunuz sorusuna “evet” “hayır” cevaplarını verilmesi durumu sınıflandırılırken nominal ölçek kullanırız.

183 5.2.2.SIRALAMA ÖLÇEĞİ Belirli vasıflara sahip birimleri belirli sıralama tabi tutulan ölçeğe sıralama ölçeği denir. Örneğin en çok okunan romanların, en çok tercih edilen, en az tercih edilene göre birinci sıradan başlayarak sınıflandırılması gibi…

184 ARALIK ÖLÇEĞİ Temsil edilen değişken belirli iki değer arasında sonsuz değer olabilir. Buna en iyi örnek sıcaklık oranlarıdır. 20 kalem 10 kalemin 2 katı değildir. Zira başlangıç noktası farklıdır.

185 5.2.4.ORAN ÖLÇEĞİ Aralık ölçeğinin tersine başlangıç noktası bellidir ve ölçüm biçimlendirilmemiştir. Oran ölçeğiyle elde edilen veriler daha sağlıklı bir biçimde matematiksel olarak kullanılır. Boy ölçümlerini buna örnek olarak verebiliriz. Boyu 90 cm olan kişinin 2 kat uzunluktadır denilebilir.

186 5.3. VERİLERİN DÜZENLENMESİ Verilerin istatiksel seriler halinde düzenlenmesi; istatiksel tahlil için oluşturulan bilgilerin belirli bir biçim ve kaidelere göre düzenlenmesinden oluşan sayısal diziye seri denir.

187 ZAMAN SERİLERİ Yapılan gözlem, araştırma seride zaman bağlı olarak yapılmışsa zaman serisinden bahsedilir. Örneğin enflasyon, yıllara göre üretim..

188 5.3.2.MEKAN (KESİT) SERİLERİ Gözlem araştırması belli bir tanıma dayanır. Mekanda meydana gelen farklılıklar ortaya çıkarılmalıdır. Örneğin şehirlere göre nüfus dağılımı hızı, yağış miktarı, fırınlara göre ekmek satış miktarı…

189 5.3.3.DAĞILMA SERİLERİ Yapılan gözlem içersindeki değişkenlerin aldığı değerlerin dağılımı değişken serilerdir.

190 BASİT SERİLER Oluşturulan kaba verilerin küçükten büyüğe veya büyükten küçüğe doğru sıralanmasıyla oluşturulan serileridir. Genelde Xk şeklinde tanımlanır. Basit serilerde küçükten büyüğe veya büyükten küçüğe doğru 1,2,3…kn sıralanmasıyla oluşturulan serilerdir. Seriler “n” ile gösterilir.

191 FREKANS SERİSİ DAĞILIMI Sınıflandırmada her bir x değerine karşı düşen o değerin frekansı tekrar edilme sayısı olarak ifade edilir. Örneğin 100 birimlik bir sınıflandırmada 10 tane farklı birim varsa 100 birim 10 sınıf dahilinde değerlendirilmiş olur. Bu 100 birimlik bir seri için geçerli, eğer serimiz çok daha fazla birimi içeriyorsa sınıflandırma yeterli gelmeyecektir ve gruplandırma yapmaya gidilecektir.

192 GRUPLANDIRILMIŞ FREKANS SERİSİ Frekans serisi basit seriye indirgenmiş ve veriler daha düzenli bir hale gelmiş olur. Bu indirgenme işlemini bir basamak daha genişletirsek gruplandırılmış frekans oluşturmuş oluruz. Eğer gözlem sayısı çok fazla ise gruplandırılarak indirgenir ve olayın çok daha net görülmesi sağlanmış olur.

193 Gruplandırılmış bir seri oluşturabilmek için şu işlem adımlarından yararlanabiliriz. 1. Veriler basit seri haline getirilir. 2. Verilerin dağılım aralığı bulunur. 3. Sınıf sayısı belirlenir. 4. Sınıf büyüklüğü belirlenir. 5. Her grubun frekansı belirlenerek seri düzenlenir.

194 6.VERİ ANALİZİ VE İSTATİSTİK

195 6.1.K ODLAMA 1 “Mesleğiniz nedir?” Analizi kolaylaştırmak için gruplamak gerekli (işçi, memur, yönetici, vs.) Kod kategorileri hem tüm meslek gruplarını kapsamalı, hem de birbirini dışlamalıdır “Siyasi görüşünüz” “Kütüphaneyi kullanma sıklığı”

196 6.2.KODLAMA 2 Veri giriş seçenekleri –Anket formlarını SPSS’e aktarmak –Cevapları kodlamak –Doğrudan veri girişi yapmak –Görüşmecilerin verileri kendilerinin girmeleri –Optik okuyucu kullanmak

197 Veri temizleme –1 Erkek 2 Kadın 0 Cevap yok (Eğer “7” işaretlendiyse hatalı= –“Kaç çocuk doğurdunuz?” (Yanıtlayan kadınsa tamam. Erkekse elenecek) –Kategorileri birleştirme –“Bilmiyorum” cevaplarını çıkararak hesaplama

198 6.3. TEK DEĞİŞKEN ANALİZİ Dağılımlar, tablolar, grafikler Merkezi eğilim ölçüleri: Ortalama, ortanca, mod

199 Çocuk ölüm oranları ve GSMH N GSMH(USD) BAE KATAR HOLLANDA BELÇİKA

200  Yukarıdaki şekle göre Burada ortalama gelir yerine ortanca alınması daha uygun Ortalamadan orijinal veriyi yeniden inşa etmek olanaksız. Dağılım hakkında bilgi veren standart sapma da verilmeli

201 6.4. İLİŞKİ ÖLÇÜMLERİ

202 6.4.1.SINIFLAMA DEĞİŞKENLERİ  Cinsiyete göre işsizlik  Tahminde yanılma payı  Çalışıp çalışmadığına göre “çalışıyor” denerek bir tahmin yapılsa 900 hata yapılacak  Oysa cinsiyeti de bilirsek ve her erkek denildiğinde “çalışıyor”, kadın denildiğinde “işsiz” diye tahmin yapsak hatayı azaltabiliriz (600 hata).

203  Lambda= 600/900 = 0.67  Cinsiyetle işsizlik istatistik açıdan birbirinden bağımsız olsaydı erkek ve kadınların dağılımı eşit olurdu. EKT Çalışıyor İşsiz Toplam

204 6.4.2.SIRALAMA DEĞİŞKENLERİ Gamma iki sayıdan oluşur: –İki değişken için aynı sırayı alan çiftler –İki değişken için zıt alan çiftler –Aynı sırayı alanlar her gözdeki rakam sağındaki ve altındaki gözlerdeki rakamların toplamıyla çarpılıyor ve birbirleriyle toplanıyor ( )

205 _Zıt sırayı alanlar her gözdeki rakam solundaki ve altındaki gözdeki rakamların toplamıyla çarpılıyor ve birbirleriyle toplanıyor ( ) –Gamma = (aynı –zıt) / (aynı artı zıt) = -.61 –Yani sosyal sınıfla önyargı arasında negatif bir ilişki var: Sosyal sınıf düzeyi yükseldikçe önyargı azalıyor.

206 6.4.3.EŞİT ARALIKLI VEYA ORANLI DEĞİŞKENLER  Pearson’sr ilişki katsayısı ve Spearmansıra-ilişki katsayısı bir değişkeni bildiğiniz takdirde diğerini tahmin etmeye dayanıyor.  r değeri gerçek değerle ortalama arasındaki farkların karelerinin toplamına eşittir.  Eksi 1 ile artı 1 arasında değişiyor.

207  0 iki değişken arasında ilişki yok; 0-.3 zayıf ilişki;.3-.6 orta ilişki; >.7 güçlü ilişki anlamına geliyor  Spearmansıra-ilişki katsayısı (rho) gerçek ölçüm değerleri yerine bu değerlerin sıralarını karşılaştırıyor  Değerlendirme aynı

208 7. KORELASYON VE REGRESYON İki veya daha çok sayıda değişken arasında bir ilişki bulunup bulunmadığı,eğer varsa bu ilişkinin derecesinin saptanması istatistikte sık araştırılan konulardan biridir. İstatistik anlamda iki değişken arasındaki ilişki,değerlerinin karşılıklı değişimleri arasında bir bağlılık şeklindedir.

209 X değişkeninin değerleri değişirken buna bağlı olarak Y değişkeninin değerleri de aynı veya zıt yönde değişiyorsa, bu iki değişken arasında bir ilişki olduğu söylenebilir. Örneğin gelir düzeyleri ile birlikte tasarrufların çoğalması,bir malın arzı artarken fiyatının düşmesi, satışlarla beraber karların yükselmesi gibi.

210 Araştırılacak değişkenlere ilişkin veriler bileşik seri şeklinde düzenleniyorsa aynı birimlerin iki ayrı değişkene göre dağılımını gösteren “bileşik dağılım serileri” ortaya çıkar.iki farklı değişkenin aynı dönemlerde aldıkları değerler inceleniyorsa “zaman serileri” ortaya çıkıyor demektir.

211 Değişkenler arasındaki ilişki bir “neden-sonuç” ilişkisi olup her zaman net ve kolay görünmeyebilir. Dolayısıyla değişkenlerin birlikte değişiyor olması her zaman aralarında bir neden-sonuç ilişkisinin var olduğu anlamını taşımaz.

212 Değişkenler arasındaki ilişkinin fonksiyonel şekli ve derecesinin bilinmesi önemlidir. Değişkenler arasındaki ilişkinin Fonksiyonel şekli regresyon analizinin, derecesi de korelasyon analizinin konularıdır.. Regresyon bilinen değerlerden yararlanıp bilinmeyen durumların tahmin edilmesinde kullanılan tekniktir. Korelasyon katsayısının değeri ise, yapılan tahminin güvenirlilik derecesini gösterir.

213 7.1. BİLEŞİK DAĞILIM SERİLERİNİN ANALİZİ Değişkenler arasındaki ilişkiyi göstermek için ilişkinin derecesi sayısal olarak belirlenebilir veya veriler bir grafik üzerinde gösterilebilir. X ve Y gözlem değerlerinin bir düzlem üzerinde birer nokta halinde gösterilmesine “serpilme diyagramı” denilir.

214 Noktaların oluşturduğu şekle bakarak ilişkinin yönü ve derecesi tahmin edilebilir.

215 7.2.DOĞRUSAL REGRESYON VE KORELASYON Regresyon analizinde serbest değişken sayısı bir ise “ basit regresyon modeli”, iki veya daha fazla ise “ çoklu regresyon modeli” olarak adlandırılır.

216 7.3.BASİT DOĞRUSAL REGRESYON Değişkenler arasında bulunduğu varsayılan gerçek doğrusal ilişki,tek bir serbest değişken içeren bir doğru denklemi ile gösterilirse basit doğrusal regresyon modeli elde edilir. Ana kütle için bu denklem şu şekilde yazılabilir: Y i = α + β x i + ε

217 Burada ε ile gösterilen değer hata(error) terimidir. Bu modelin “α ve β” parametrelerini bulmak için x serbest değişkeni ve Y bağımlı değişkeni ile ilgili gözlemlere ihtiyaç vardır. Bu değişkenlerin ana kütlelerini oluşturan bütün değerleri bilmek imkansız olduğu için örneklemeye başvurulur.

218 Böylelikle α ve β parametrelerinin tahmini olan “ a ve b” katsayıları bulunabilir. Örnek için de aynı denklem ; y= a + bx + e Şeklinde yazılır. α ve β parametrelerinin bir tahmini olan “a ve b” katsayıları “en küçük kareler yöntemi” kullanılarak hesaplanabilir.

219 Elimizde gözlemle elde ettiğimiz n adet ikili değerler( x ve y ) varsa ve aralarında doğrusal bir ilişkinin olduğu tahmin ediliyorsa bunları bir doğru denklemi ile ifade edebiliriz. Bu durumda her x değeri için iki tane y değeri olacaktır.

220 Bunlardan birincisi ölçülen gerçek y değeri, diğeri ise denklemle elde edilen teorik y değeridir. Bu iki değer arasındaki farklar i. gözlem için: e = y i - (a + b x i ) şeklindedir.farkların kareleri toplamının minimum olması gerektiğinden Σ e 2 = Σ (y i - (a+ b x i )) 2 = minimum yazılır. (i= 1,...,n)

221 Denklemi minimum yapmak için a ve b katsayılarına göre kısmi türev alınarak sıfıra eşitlenir. de/da= 2 Σ (-1)(y-a-bx) =- Σy + n*a +b Σ x =0 de/db= 2 Σ (-x)(y-a-bx) =- Σxy + a Σ x +b Σ x 2 =0

222 Negatif işaretli terimler eşitliğin sağ tarafına geçirilir ve normal denklemler aşağıdaki gibi elde edilir. Σy = n*a + b Σ x Σxy = a Σ x +b Σ x 2

223 ÖRNEK: Σ x = 40 Σ y =12 Σx 2 =426 Σx*y = 115 Δ = 1704 – 1600 =104 Δ a =5112 –4600 = 512 Δ b = 460 – 480 = -20 YILLARXY X2X2 X*Y

224 a = b = denklem : y = – x bu denklemi kullanarak x’ in herhangi bir değeri için y’ nin bir tahmini yapılabilir. örneğin, x=8 için tahmini y değeri 3.38 dir.

225 7.4.REGRESYON KATSAYININ TESTİ Regresyon denklemindeki a katsayısı sabit olduğu için iki değişken arasındaki ilişkiyi göstermemektedir. Bundan dolayı testler b katsayısı için yapılır. Testlerin amacı değişkenler arasındaki ilişkinin güçlü olup olmadığını araştırmaktır.

226 Hipotezler şu şekilde yazılırlar: H 0 : B = 0 (Ana kütlede x deki bir birimlik değişim y yi etkilememektedir,iki değişken arasında ilişki yoktur.) H 1 : B ≠ 0 (Ana kütlede x deki bir birimlik değişme y de önemli bir değişme yapar.iki değişken arasındaki ilişki önemlidir. )

227 Anlamlılık düzeyi( α ) bu testlerde küçük tutulmakta genellikle %1 veya %5 kullanılmaktadır. Örnek regresyon katsayısının standart değişkene dönüştürülmesi için aşağıdaki durumlar dikkate alınır: n < 30 ise (n-2) serbestlik derecesi alınarak t dağılımı, n≥ 30 ise z(normal dağılım) kullanılır.

228 Standart değişkenler şu şekilde hesaplanmaktadır. t= b-Bz= b-B S b S b S b, b katsayısının standart hatasının tahmini olup aşağıdaki gibi hesaplanır: Sb= Syx (x-x)2

229 Örnek: İstatistik dersinden başarının matematik dersinden başarıya bağımlı olup olmadığını araştırmak üzere 8 öğrenci seçilmiş ve iki dersten aldıkları notların aşağıdaki gibi olduğu görülmüştür( notlar 10 üzerindendir.) İstatistik notuMatematik notu

230 En küçük kareler doğrusunu bulalım: x2x2 x*y

231 Σ x = 48 Σ y =40 Σx 2 =336 Σx*y = 285 Δ = 384 Δ a = –240 Δ b = 360 a = b = denklem : y = x Standart hatanın bulunması için yukarıda bulunan denklemde x değerleri yerine konularak y ' değerleri hesaplanır ve (y - y ' ) farklarının kareleri alınır. Örneğin y =1 için y ' = 1.250, (y - y ' ) = olarak bulunur.

232 Σ(y- y ' ) 2 = (y- y ' )

233 7.5.KORELASYON ANALİZİ İki değişken arasındaki doğrusal ilişkinin derecesi “ r “ ile gösterilen korelasyon katsayısı ile ölçülür. Korelasyon katsayısı iki değişkenin değişimlerinin ne kadar uygun olduğunun bir ölçüsüdür ve değeri –1 ile +1 arasında değişir. -1 ≤ r ≤ +1

234 r = 0 olduğunda değişkenler arasında doğrusal bir ilişki olmadığı söylenir. r = +1 ise pozitif tam doğrusal ilişki, r = -1 ise negatif tam doğrusal ilişki var demektir. Aşağıdaki şekillerde bu durumlar gösterilmektedir:

235

236 Korelasyon katsayısı geliştirilen değişik formüller yardımıyla hesaplanmaktadır. Aşağıda verilen formül bunlardan bir tanesidir:

237 7.6. KORELASYON KATSAYISI İLE İLGİLİ HİPOTEZ TESTLERİ Korelasyon katsayısı ile iki değişken arasındaki ilişki ölçülmekte, katsayı sıfıra yakın çıkarsa ilişkinin zayıf, bire yakın çıkarsa ilişkinin kuvvetli olduğu söylenebilmektedir. r değerlerinin istatistik açıdan bir anlam taşıyıp taşıyamayacağı konusunda bazı testler uygulanmaktadır.

238 Örneğin alındığı ana kütleyi iki değişkenli ve normal dağılıma sahip bir ana kütle olarak kabul edersek, ana kütle ile ilgili bir teorik korelasyon katsayısının ρ(rho) bulunduğunu ve bunun örnek korelasyon katsayısı r ile tahmin edilebileceğini söyleyebiliriz.

239 ρ= 0 ise r nin dağılımı simetrik olmakta ve t dağılımına uymaktadır. ρ≠ 0 durumunda ise dağılım asimetrik olacaktır. Korelasyon katsayısının anlamlılığını ölçmek için t testini uygulayacağız ve ρ= 0 şeklindeki sıfır hipotezinin testi için aşağıdaki formülü kullanacağız: t = r*√ n-2 √ 1 – r 2

240 İstatistik ve matematik notlarının verildiği örneği ele alırsak hipotezler aşağıdaki gibi olacaktır: H 0 : ρ= 0 ana kütlede x ve y değişkenleri arasında ilişki yok H 1 : ρ≠ 0 ana kütlede x ve y değişkenleri arasında ilişki var Anlamlılık düzeyi olarak α = 0.05 alalım. Tablodan kritik t değeri serbestlik derecesi(n-2) için t 0.05 / 2 = bulunur.

241 Örnek: aşağıda verilen değerlerden yararlanarak korelasyon katsayısını hesaplayınız. H 0 : ρ= 0 H 1 : ρ> 0 Hipotezlerini α = 0.05 alarak test ediniz.

242 Σ X = Σ X 2 = Σ X * Y = Σ Y =166.8 Σ Y 2 = X Y

243 r = (611.26) / (835.38) = 0.73 kritik t değeri t 0.05 = 1.86 t= (2.064) / (0.6834) = > 1.86 olduğu için H 0 reddedilecektir.

244 7.7.SIRA KORELASYONU Değişkenlerin gerçek değerlerini kullanmak yerine yada kesin değerler elde edilemediğinde veriler, büyüklüklerine,önemlerine ve benzeri özelliklerine göre 1,2,……… … … …,N şeklinde numaralanarak sıralanırlar.

245 Eğer x ve y değişkenlerinin değerleri aynı kurala göre dizilmişse Spearman sıra korelasyon katsayısı formülü kullanılarak değişkenler arasındaki ilişki araştırılır. Formül aşağıdaki gibidir; r sıra = 1 - 6* Σ D 2 N( N 2 – 1) Burada kullanılan N, verilerdeki x ve y çiftinin sayısını, D ise aynı sıradaki x ve y değerleri arasındaki farkı göstermektedir.

246 Örnek: Aşağıdaki tabloda alfabetik sıraya göre dizilmiş 10 öğrencinin bir dersten aldığı laboratuar ve seminer notları verilmektedir. Spearmann sıra korelasyon katsayısı formülünü kullanarak iki ders arasındaki ilişkinin kuvvetini hesaplayınız. Lab Semine r

247 Değişkenler arasındaki farklar ve kareleri şu şekildedir: Σ D 2 = 24 Seminer ve laboratuar başarıları arasında dikkate değer bir ilişki vardır. D D2D

248 7.8.ÇOKLU REGRESYON VE KORELASYON Çoklu regresyonda birden fazla bağımsız değişken ( x 1, x 2, ………, x n ) ile bir bağımlı değişken( y ) arasındaki ilişki incelenmektedir. Bir firmanın satışlarına reklam harcamaları ile tüketici gelir düzeyinin katkısı, toprağın veriminin sulama, gübreleme hava şartlarından nasıl etkilendiğinin incelenmesi çoklu analiz için örnek verilebilir.

249 Burada kullanılacak regresyon fonksiyonu her bağımsız değişkenin bağımlı değişkenle doğrusal bir ilişkisi olduğu kabul edilerek;, y = a + b 1* x 1 + b 2 * x 2 + …………..+ b n * x n şeklindedir.

250 Bu fonksiyondan yararlanarak değişkenler arasında bulunduğu varsayılan gerçek çoklu ilişkinin bir tahmini aşağıdaki fonksiyon yardımıyla yapılmaktadır. y = α + β 1* x 1 + β 2 * x 2 + …………..+ β n * x n

251 Bu fonksiyondaki katsayıların hesabı için en küçük kareler yönteminden yararlanarak gerçek y değerleri ile teorik y değerleri arasındaki farklar minimize edilecektir. Σ ( y i - ( α + β 1* x 1i + β 2 * x 2i ) ) 2

252

253 Üç değişkenli bir modelde her noktanın üç koordinata sahip olduğu ve bir yüzey hesaplanacağı için denklem bir doğru denklemi olmayıp yukarıdaki şekilde gösterildiği gibi en küçük kareler yüzeyidir. Burada da gerçek y değerleri (y i ) ile teorik y değerleri arasındaki uzaklıkların farklarının kareleri toplamı minimum yapılacaktır.

254 En küçük kareler yöntemi ile üç katsayı şu şekilde hesaplanacaktır: n n Σ x  Σ x 1i, Σ x 1* x  Σ x 1i x 2 i,i=1 n Σ x 1* y ---  Σ x 1i * y i i=1

255 şeklinde alınarak; Σ y = n*a + b 1* Σ x 1 + b 2 * Σ x 2 Σ x 1* y = a* Σ x 1 + b 1* Σ x b 2 * Σ x 1* x 2 Σ x 2* y = a* Σ x 2 + b 1* Σ x 1* x 2 + b 2 * Σ x 2 2

256 Örnek: Aşağıdaki veriler bir çeşit alaşımdan yapılan çubukların kırılma testleri için bükülme sayıları ile alaşıma giren elementlerin yüzdelerini göstermektedir.

257 Bükülme Sayıları (y)A elementi yüzdesi(x 1 )B elementi yüzdesi(x 2 )

258 n = 16, Σ x 1 = 40, Σ x 2 = 200, Σ x 1 2 = 120, Σ x 1* x 2 = 500, Σ x 2 2 = 3000 Σ y = 733, Σ x 1* y =1989, Σ x 2* y = 8285

259 a b1 = b2 8285

260 Çözüm sonunda katsayılar aşağıdaki gibi çıkmaktadır: a= , b 1 = 7.825, b 2 = gözlemlerden elde edilen veriler için tahmin edilen denklem: y ≈ * x * x 2 şeklindedir.

261 Bazı x 1 ve x 2 değerlerini yukarıdaki denklemde yerine koyarak tahmin edilen y değerlerine bakalım: x 1 = 1, x 2 = 10 y= olarak bulundu, gerçek değer y= 40

262 Buradan hareket ederek değişkenlerin tabloda olmayan değerlerini de tahmin edebiliriz: örneğin x 1 = 2.5, x 2 = 12 alındığında y= 46.7 olarak tahmin edilebilmektedir. x 1 >x 2 olduğu için alaşımdaki x 1 yüzdesinin bükülme sayısını daha fazla arttıracağı söylenebilir.

263 x 1 ve x 2 aynı birimlerle ifade edilebiliyorsa hangisinin y değişkenini daha fazla etkileyebileceği anlaşılabilir. Bağımsız değişkenlerin farklı birimlerde olduğu durumlarda karşılaştırma yapabilmek için standart kısmi regresyon katsayılarını hesaplamak gerekir.

264 8.STANDART SAPMA Olasılık kuramı ve istatistik bilim dallarında, bir ana kütle veya bir örneklem veya bir olasılık dağılımı veya bir rassal değişken için standart sapma, veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Matematik notasyonunda genel olarak, bir ana kütle veya bir rassal değişken veya bir olasılık dağılımı için standart sapma σ ile ifade edilir.

265 Standart sapma varyansın kareköküdür. Daha matematiksel bir ifadeyle değerlerinin aritmetik ortalamadan farklarının karelerinin toplamının veri sayısı -1'e bölümünün kare köküdür, yani verilerin ortalamadan sapmalarının kareler ortalamasının karekökü olarak tanımlanır. Standart sapma kavramının yayılma ölçüsü olarak kullanılmasını anlamak için ölçüme bakmak gerekir.

266 Diğer yayılma ölçüsü olan varyans verilerin ortalamadan farklarının karelerinin ortalaması olarak tanımlanır. Böylece varyans ölçüsü için veri birimlerinin karesi alınması gerekir ve varyansın birimi veri biriminin karesidir. Bu durum pratikte istenmeyen sonuçlar yaratabilir

267 Örneğin: Bir basit ana kütle için kilogram birimi ile veri (4, 8, 12) olsun. Aritmetik ortalama 8 olur ve verilerin ortalamadan sapmaları (−4, 0, 4} olur. Kare toplamlarının ortalaması olan varyans [(4-8) 2 +(8-8) 2 +(12-8) 2 ]/2 = 32/2 = 16 olur ve kilogram kare birimi ile verilir. Standart sapma 16’nin karekökü olup 4 değerdedir ve kilogram birimi ile ölçülür.

268 Standart sapma genel olarak niceliksel ölçekli sayılar için en çok kullanılan verilerin ortalamaya göre yayılmasını gösteren bir istatiksel ölçüdür. Eğer bir çok veri ortalamaya yakın ise, standart sapma değeri küçüktür; eğer birçok veri ortalamadan uzakta yayılmışlarsa standart sapma değeri büyük olur. Eğer bütün veri değerleri tıpatıp aynıysa sapma değeri sıfırdır.

269

270 8.1.RASSAL DEĞİŞKEN İÇİN STANDART SAPMA Bir rassal değişken olan X için standart sapma şöyle tanımlanır: Burada E(X) X için beklenen değer yani ortalama ve Var(X) X için varyans değeridir.

271 Her rassal değişken dağılım tipi için bir standart değer var olması gerekli değildir. Çünkü bazı dağılımlar için beklenen değer bulunamaz. Örneğin, Cauchy dağılımı gösteren bir rassal değişken X için bir standart sapma yoktur; çünkü E(X) tanımlanamaz.

272 Bir aralıklı tekdüze dağılım gösteren rassal değişken X için standart sapma şöyle hesaplanır: Her x i değeri için x i le ortalama değer olan arasında olan farklar olarak bulunur. Bu farkların kareleri hesaplanır. Bu farkların karelerinin ortalaması bulunur. Bu değer varyans, yani σ 2, olur.

273 8.2.ANAKÜTLE STANDART SAPMA DEĞERİNİN ÖRNEKLEM STANDART SAPMA KULLANILARAK KESTİRİM Pratik hayatta, her bir ana kütle elemanın ölçülmesini gerektiren bir ana kütle standart sapma değeri bulmak, bazı çok nadir haller dışında (örneğin standart hale getirilmiş mekanik test etme), hiç realistik değildir. Nerede ise her halde, ana kütleden bir rastgele örneklem alınır ve bu örneklemden ana kütle standart sapması için bir kestirim değer bulunur.

274 Bu kestirim, çok kere örneklem standart sapmasını ana kütle standart sapmasının aynı olan bir formülü kullanmak suretiyle yapılır: Burada örneklem değerleri ve örneklem ortalamasıdır. Bölen değer olan N − 1 vektörü içinde bulunan serbestlik derecesi olur.

275 Bu belki bir bakıma uygundur; çünkü eğer bir ana kütle varyansının kavramsal olarak var olduğu biliniyorsa ve örneklem için ana kütleden her eleman çekiminden sonra bu eleman geri konulursa, bilinmektedir ki örneklem varyansı (yani s 2 ) ana kütle varyansı (yani σ 2 ) için bir yansız kestirim olur.

276 Ancak bu standart sapmalar için doğru değildir ; yani yukarıdaki gibi bulunan örneklem standart sapması (s) ana kütle standart sapması (σ) için yansız kestirim değeri değildir ve s ile ana kütle standart sapması biraz daha küçükçe tahmin edilir.

277 Eğer rassal değişken normal dağılım gösteriyorsa, bu yansız olan kestirim pratikte çok kolay olmayan bir dönüşüm ile elde edilebilmektedir. Ayrıca zaten bir kestirim için yansız olmak karakteri her zaman çok istenir bir özellik değildir. Çok kullanılan diğer bir kestirim ise benzer bir ifade ile şöyle verilir.

278 olur. Eğer ana kütle normal dağılım gösteriyorsa, bu şekildeki kestirim yansız kestirimden her zaman biraz daha küçük ortalama hata karesi gösterir ve bu nedenle normal için maksimum olabilirlik kestirimi olur.

279 8.3.BİR SÜREKLİ RASSAL DEĞİŞKEN İÇİN STANDART SAPMA Sürekli olasılık dağılımları için genellikle standart sapma değerinin dağılıma özel olan parametreleri kullanılarak hesaplanması için formül vardır. Genel olarak ise, p(x) olasılık yoğunluk fonksiyonu olan bir sürekli rassal değişken olan X için standart sapma şöyle verilir:

280 8.4.STANDART AÇIKLAMA VE UYGULAMA Belli bir seri sayı için standart sapma değerini bilmek ve bu kavramı anlamak demek bir ortalama etrafında bu serinin ne kadar yayılım gösterdiğini anlamaktır. Standart sapmanın büyük olması veri noktalarının ortalamadan daha uzak yayıldıklarını; küçük bir standart sapma ise ortalama etrafında daha çok yakın gruplaştıklarını gösterir.

281 Standart sapma belirsizliğin bir ölçüsü olarak hizmet edebilir. Fiziksel bilimlerde, tekrar tekrar yapılan deneyler ve deneylerde alınan ölçüler ise gösterilen standart sapma olduğu bu deneyin ölçülmesindeki kesinlik ve doğruluğunu gösterir.

282 Ölçümlerin teoriye dayanan bir tahmin ile karşılaştırıp birbirine uygunluk gösterip göstermediğine karar vermede ölçümlerin standart sapması önemli rol oynar. Eğer ölçümlerin standart sapması teorik tahminden çok daha uzaksa, sınanan teorinin değiştirilmesi gerekir. İşte bu uzaklık standart sapmalarla belirlenir.

283 Finansmanda, standart sapma verilmiş bir menkul (hisse seneti, tahvil, emlak v.b) için rizikonun veya bir menkuller portföyü için rizikoları temsil eder. Bir yatırım portföyünün etkin olarak idare edilmesini tayin eden en önemli faktörlerden birisi rizikodur.

284 Çünkü her tek bir menkulün veya bir menkuller portföyünün getirisindeki mümkün yayılımını riziko tanımlar ve rizikonun standart sapma ile tanımlanması ise yatırım kararları için bir matematiksel temel sağlar. En geniş kavramla, yatırım rizikosu arttıkça menkul veya menkuller portföyünün beklenen getirisi da artış gösterir.

285 Buna neden yatırımcıların menkul getirileri için riziko primlerini artırmaları olarak açıklanır. Diğer bir deyişler, eğer bir yatırım daha yüksek riziko seviyesi taşıyorsa, yatırımcılar o yatırımından daha yüksek bir getiri beklemeleri gereklidir.Uzunca bir zaman içinde herhangi bir menkul için yıllık getirilerinin ortalamasını bulmakla o menkul için beklenen getiri değerini vermektedir.

286 Her yıl için elde edilen getiriden bu beklenen getiri farkı bulunursa buna finansmancılar ve muhasebeciler tarafından varyans adı verilir (Dikkat edilirse bu istatistiksel varyans kavramından farklıdır). Her bir yıl için varyansın karesini bulmak ve bu varyans karelerinin ortalamasının kare kökü o menkulün standart sapmasını yani rizikosunu gösterir.

287 Bu rizikolar yani varyansların karelerinin toplamının ortalamasının kare kökü, standart sapmadır ve rizikoyu ölçer. Menkullerin karşılaştırılımı için temel çalışma işte bu ölçü ile yapılır.Standart sapmalar için pratik uygulamalar daha değişik alanlarda da verilebilir; fakat burada bu ufak sayıda uygulamalar bile standart sapmanın uygun bir şekilde önemini ortaya çıkartmaktadır.

288 8.5.NORMAL DAĞILIM GÖSTEREN VERİLER İÇİN KURALLAR Pratikte, çok zaman verilerin yaklaşık olarak bir normal dağılım gösteren ana kütleden geldiği varsayılır. Bu varsayıma neden olarak merkezsel limit teoreminin geçerliliği iddiası olur. Merkezsel limit teoremine göre birçok birbirinden bağımsız ve hepsi aynı dağılım gösteren rassal değişkenlerin toplamı limitte bir normal dağılıma göre eğilim gösterirler.

289 Eğer bu varsayım geçerli ise, değerler yaklaşık %68,27 olasılıkla ortalamadan eksi ve artı bir standart sapma noktalarının arasında bulunur; ortalamadan artı ve eksi 2 standart sapma noktaları arasında %95,45 olasılıkla ve ortalamadan artı ve eksi 3 standart sapma noktaları arasında %99,73 olasılıkla bulunur. Bu kuralı veya bir emprik kural olarak bilinir.

290

291 8.6.ÇEBİŞEV’İN EŞİTSİZLİĞİ Yakınlık standart sapma birimlerinde ifade edilirse, herhangi bir veri serisi için, Çebişev'in eşitsizliği ile ispat edilmiştir ki veri değerlerin çok büyük bir çoğunluğu ortalama değere yakındır. Çebişev'in eşitsizliği sadece normal dağılım gösteren seriler için değil, bütün rastgele dağılım gösteren veri serileri için geçerlidir.

292 Ortalamadan √2 standart sapma uzaklıkları arasında değerlerin en aşağı %50si bulunur. Ortalamadan 2 standart sapma uzaklıkları arasında değerlerin en aşağı %75i bulunur. Ortalamadan 3 standart sapma uzaklıkları arasında değerlerin en aşağı %89u bulunur.

293 Ortalamadan 4 standart sapma uzaklıkları arasında değerlerin en aşağı %94ü bulunur. Ortalamadan 5 standart sapma uzaklıkları arasında değerlerin en aşağı %96sı bulunur. Ortalamadan 6 standart sapma uzaklıkları arasında değerlerin en aşağı %97si bulunur.

294 Ortalamadan 7 standart sapma uzaklıkları arasında değerlerin en aşağı %98i bulunur. Genel olarak: ortalamadan k standart sapma uzaklıkları arasında değerlerin en aşağı %(1 − 1/k 2 ) × 100 si bulunur.

295 8.7.STANDAT SAPMA VE ORTALAMA ARASINDAKİ İLİŞKİ Çok kere bir veri serisinin özetlenmesinde ortalama ve standart sapma birlikte bildirilmektedir. Bir anlamda, eğer ortalama verilerinin merkezi olarak kullanılan ölçü ise, standart sapma veri yayılımının doğal ölçüsüdür. Buna neden ortalama noktasından standart sapmanın, verinin herhangi bir noktasından standardize edilmiş sapmadan daha küçük olduğudur

296 x 1,..., x n reel sayılar olsun ve şu fonksiyon tanımlansın: Ya birinci türev alınıp sıfıra eşit yaparak veya daha kolay bir cebirsel yol olan kare tamamlaması kullanarak σ(r)’nın tek ve sadece tek bir minimum noktasının aritmetik ortalama olduğu gösterilebilir.

297 Standart sapma ile ortalama arasındaki diğer bir ilişki ise yayılım özelliğine dayanan veri karşılaştırılmaları için kullanılan varyasyon katsayısıdır. Bir veri serisi için varyasyon katsayısı standart sapma ile ortalama arasındaki orandır. Böylece, standart sapma veri birimleri ile boyutlu iken; varyasyon katsayısı boyutsuz sırf bir sayıdır.

298 9.PARAMETRİK OLMAYAN İSTATİKSEL TEKNİKLER

299 9.1.ANAKÜTLE Anakütle kavramı insan, yer topluluğunu ifade etmek için kullanılır. İlgi alanına göre, araştırmacı hangi topluluk üzerinde duruyorsa bu topluluğu oluşturan birimlerin tümüne birden anakütle denir.

300 Belirli bir araştırmacı, AB Devletleri’ndeki bütün üniversitelerde öğrenim gören tüm öğrenciler hakkında bazı yargılara varmak isteyeceği gibi; diğer bir araştırmacı sadece belli bir üniversitedeki tüm öğrenciler hakkında bir kısım yargılara varmak isteyebilir. Her iki araştırmacı hakkında yargıda bulunmak istediği öğrenci topluluğunu anakütle olarak düşünür.

301 Bazı ders kitaplarında insan, yer, eşya toplulukları üzerinde yapılan ölçümler topluluğu anakütle olarak ifade edilir. Mesela belirli bir üniversitedeki tüm öğrencilerin yaşlarıyla ilgilendiğimiz taktirde öğrencilerin yaşların oluşturduğu topluluk anakütle olarak görülür.

302 Başka bir ifadeyle anakütle, ilgi sahamız içersindeki insan, yer ve şeylerin (ölçümleri de kapsayan) en geniş topluluğudur. Anakütle sonlu veya sonsuz olabilir.

303 9.2.ÖRNEK Örnek, belirli bir anakütlenin bir kısmıdır. Örneğin belirli bir anakütle belirli bir üniversitedeki tüm öğrencilerden oluşsun. Anakütlenin bir parçası olarak söz konusu üniversitede istatistik derslerine katılan öğrenciler topluluğu bir örnektir.

304 9.3.ŞANS ÖRNEĞİ Analitik istatistik belirli bir anakütleden çekilen örneğe ait bilgilerden anakütle hakkında çeşitli yargılara varmadan ibarettir. Anakütle hatırı sayılır derecede büyük veya sonsuz ise bir bütün olarak anakütle hakkında varılacak yargının temeli olan bilgiyi sağlamak için anakütledeki her bir birimi incelemek pratik olamayan veya imkansız denecek kadar zor bir çalışmadır.

305 Bu ve diğer bazı sebeplerden dolayı bir anakütle hakkındaki yargıya anakütleden çekilen bir örnekteki bilgiye bağlı olarak varılır. Bir anakütle hakkında bir kısım yargılara varmak için analitik istatistik kullanmakla her zaman anakütleden alınan örnek elverişli sonuçlar sağlamayabilir.

306 İstatistiki tahlile bağlı sonuçlardaki değişkenlik anakütleden örneğe ( ki bu örneğe tesadüfi örnek denilir.) tesadüfi yöntemlerin kullanılmasıyla birim seçileceği faraziyesinden kaynaklanır.

307 9.4.PARAMETRE Parametre, belirli bir yoğunluk fonksiyonunun özel formunu tarif eden bir sabittir. Anakütle ortalaması n, anakütle varyansı ve anakütle korelasyon katsayısı p birer parametre örneğidir. Parametre değeri genellikle bilinmez ve bilindikleri zaman örnek istatistikleri bunları tahmin etmek için kullanılır.

308 9.5.PARAMETRİK OLMAYAN TEKNİKLERİN AVANTAJLARI 1- Çoğu parametrik olmayan istatistik teknikler en az varsayıma dayandıklarından onların yanlış uygulanma şansı küçüktür. 2- Bazı parametrik olmayan istatistik prosedürlerinde özellikle elle yapılan hesaplamalar daha çabuk yapılabilir.

309 Böylece zaman tasarrufu sağlanabilir. Bu özellik analizlerin çabucak sonuçlanması gerektiğinde ve yüksek seviyeli hesap araçlarının bulunmaması durumunda daha çok önem kazanır.

310 3-Matematik ve istatiktik konularında çok az bilgiye sahip araştırmacılar parametrik olmayan istatistik tekniklerini genellikle daha kolay anlamaktadırlar. 4-Parametrik olmayan istatistik teknikleri sıra verileri gibi zayıf bir ölçekle oluşmuş verilere uygulanabilir.

311 9.6.PARAMETRİK OLMAYAN TEKNİKLERİN DEZAVANTAJLARI 1-Hesaplanması daha kolay olduğu için eldeki verilere parametrik teknikleri uygulamak mümkünken parametrik olmayan teknikleri tercih edilebilir. Halbuki parametrik teknikler bu gibi durumlarda daha elverişli sonuçlar sağlarken, parametrik olmayan istatistik teknikler bilgi israfına sebep olur.

312 2-Sadece basit bazı hesapları gerekli kıldığı için parametrik olmayan istatistik teknikler uygulanması en çok arzu edilen tekniklerdir. Bununla birlikte örneklerin geniş hacimde olması ve özellikle hesaplamaları yapmak için elimizde bilgisayar bulunmaması durumunda, elle yapılması gerekli hesaplamalar uzun ve yorucu olacaktır.

313 9.7.PARAMETRİK OLMAYAN İSTATİSTİK TEKNİKLER NE ZAMAN KULLANILIR? 1-Test edilecek hipotez anakütle parametreleri hakkında değilse parametrik olmayan hipotez testleri kullanılabilir. 2-Mevcut veriler parametrik bir prosedür için gerekli olandan daha zayıf bir ölçekle oluşmuş ise yine parametrik olmayan istatistik teknikler kullanılabilir.

314 Mesela, eldeki veriler diğer bazı parametrik metotları elverişsiz kılacak türden sıralama veya numaralama verilerinden oluşuyor ise parametrik olmayan tekniklerin kullanılması daha güvenilir sonuçlar sağlar.

315 3-Parametrik bir prosedürün kullanılması için gerekli olan yaklaşımlar sağlanamıyorsa parametrik teknikler büyük ölçüde güvenilirliklerini yitirirler. Bir 90k durumunda bir araştırma projesini düzenlerken parametrik bazı prosedürlerin kullanılması gerekebilir.

316 Bununlar birlikte, verilerin muayene edilmesi sunucu yapılacak testin dayandığı bir veya daha fazla yaklaşımın ihlal edildiği gözlenebilir. İşte bu gibi durumlarda çoğu kez parametrik olmayan metotları kullanmaktan başka çare yoktur.

317 4-Sonuçlar acele gerekli ise, elde kullanılacak bilgisayar yoksa ve hesaplamalar elle yapılacaksa, parametrik olmayan teknikleri kullanmak genel fikir verme aşamasından kaçınılmazdır.

318 Bu durumda örneğin çekileceği anakütlenin aşırı derecede çarpık veya basık olması yüzünden, merkezi limit teoremlerinin sağladığı avantajlardan yararlanamayız.

319 10.İSTATİSTİK NE İŞE YARAR? İstatistik, duruma uygun bir sonuç çıkarmak üzere toplanan verilerin analiz edilmesidir. Tanımdan anlaşıldığı üzere sonuç çıkarılabilecek bir durum vardır. İstatistiki durumdan kasıt da sürekli veri toplanabilecek bir alanda bulunulmasıdır.

320 Üretilen malın yüzde kaçı hatalıdır, öğrencilerin kaç tanesi başarı çizgisini aşmıştır, bir nükleer reaktör çekirdeğindeki maddeden salınan enerji miktarı hangi düzeyden alçak veya yüksek olmalıdır gibi cevabı kesin olarak bilinen sorulara ait cevap çizelgelerini hazırlamakla kalmaz, istatistik aynı zamanda geleceğe ışık tutmak amacındadır.

321 Gelecek yıl kaç kişi sınavı kazanacak, üretim zarar miktarı ne olur, yılın bir zamanında yayınlanan hangi program en yüksek reklamı alır, gibi sorulara belirli aralıklarda kesin cevaplar verir. Zaten şans oyunları hakkında olasılık hesaplarının geliştirilerek matematik formüllerle ifade edilen bir veri toparlama ve çözümleme bilimine yol açmış halidir diye de bakılabilir istatistiğe.

322 Nitekim her istatistik kitabının ilk konusu olasılık hesaplarına ve formüllerine en azından kısa bir bakış olur. Ortalama zekaya sahip bir insan bir olasılık ve istatistik kitabını alıp yönergeleri izleyerek bu veri çözümleme işlerini yapabilir. Çünkü istatistik formüllerin anlamını tanımlayabilecek bir yorumlama yeteneği ve basit formül kullanma bilgisinden başka bir şey gerektirmez.

323 İstatistik ile yapılabilecekler bu basit işlerden çok daha fazlasıdır. Bugün birçok istatistikçinin farkına varamadığı gerçek odur ki; istatistik bilimi yalnızca veri toparlayıp, basit formüllerle sonucu belirlemek, aynı veri grubu için geleceğin sınırlarını çizmek değildir. Bunlar zaten işin aritmetik kısmıdır.

324 10.1.İSTATİSTİK İLE İNSAN DAVRANIŞLARININ RASYONELLİĞİ ÖLÇÜLEBİLİR Mİ?

325 Bu soru şuna eşittir: İnsan davranışları önceden öngörülebilir mi? Rasyonelliği ölçebiliyorsanız, ortada rasyonel olan bir şeyler var demektir. Davranışlar rasyonel olabilir mi? Yani mantıklı nedenlere bağlı olarak, insan davranışları modellenebilir mi? Öngörülebilir mi?

326 Şehirde yaşayan, işi, evi, ailesi olan bir insanı dikkate alalım. Bu insan için öngörülebilen davranışları sıralayalım: Yılın en az 330 gününde, haftanın en az 5 gününde; saatleri arasında işinde olabilir, en az pazar günü; ya evinde ya da ev dışında olabilir. Bütün diğer insanlar için buna benzer bir öngörü oluşturabiliriz.

327 Bireyi göz önüne aldığınızda işi veya yapması gerekenler dışındaki zamanlarda davranışlarını öngörmek zayıf tahminden öteye gitmez. Kişinin yaşamında anormal bir gelişme olmadığı sürece zamanında yaptığı işi öngörülebilir. İnsanların topluluk halindeyken davranış öngörüleri, birey halindeki davranış öngörülerinden daha doğru ve kesin olarak yapılabilir.

328 Bunun sebebi topluluk halindeyken her bireyin davranışlarının kendi isteği dışında da geçerli olan kontrol etkenlerine bağlı olmasıdır. Topluluk belirli bir yöne hareket ediyorsa ve birey bu topluluğun parçasıysa birey de aynı yöne gitmek durumundadır. İstatistiğin profesyonel kullanımlarına başladık.

329 İstatistiki bilginin geçersizliğine ancak fizikteki 'başlangıç durumuna hassas bağlılık' prensibi neden olabilir. Bu öngörülemeyecek olayların bileşkesi ile artar. İstatistikçilerin genelde düşündüğü budur. Genellikle tek ve kontrol edilebilir veya gözlemlenebilir veri grubu işlem için uygundur.

330 Çoklu regresyon analizinde işler yeterince olmasa da mümkün olduğunca karışır. Hesap tekniğinde n>=2 boyutlu yaklaşımlar gerekir. Birden çok etken bir arada hesaplanabilirse gelecek öngörülebilir.

331 ÖRNEK-1 Şekilde k1, k2, k3 kapıları görülüyor. Bu kapılar tek yönlü çalışıyor. a, b ve c yönlerinden gelen insanlar için nasıl bir düzenleme yapılmalıdır ki insan trafiği hızlandırılsın?

332 Aklımıza gelecek ilk cevap şöyledir: Karşılıklı yönlere gidip geri dönen bireyleri göz ardı edersek, a yönünden gelen kişi k1 kapısından, b‘den gelen k3'ten ve c'den gelen k2'den geçecektir. Peki bu varsayım hangi şartlar altında doğrudur? Bu varsayım k1 ve k3 kapıları k2'den en az x mesafesinde iken doğrudur denebilir.

333 Ayrıca karşı yönlere gidenleri hesaba katarsak bu varsayım sonuçlarını %90 oranında öngörebilir denebilir. İstatistik gözlemleri yapılırsa; k1 ve k3, k2'ye x'den az mesafedeyse olacakların şöyle olduğu gözlenebilir: a ve b yönleri için söylenenler aynı, yalnız c yönünden gelenlerin kimi k1'den, kimi k3'den geçiyor. Genel olarak;

334  a'dan gelenlerin; %80'i k1'den, %15'i k3'ten, %5'i k2'den geçiyor,  b'den gelenlerin; %75'i k3'den, %20'si k1'den, %5'i k2'den geçiyor  c'den gelenlerin; %60'ı k2'den, %25'si k1'den, %15'i k3'den geçiyor sonucu bulunabilir.

335 Peki bu sonuç nasıl değerlendirilebilir. Örneğin güvenlik veya diğer başka sebeplerle; k1 ve k3 belirli bir mesafede inşa edilebilir ve k2'nin yapılmasına gerek kalmaz. Belki c yönü c1 ve c2 yönleri olarak iki yöne ayrılabilir. Bu durum a kapısına 2/5, b kapısına da 2/9 ek trafik yükü bindirir o kadar. Bu problemi insan geçişi değil, deniz-kara-hava trafiği problemlerine uyarlayabilirsiniz.

336 ÖRNEK-2 Hayali bir savaş anını düşünelim. Burada denizaltılar ve onları vurmak isteyen düşmanları var. Düşmanlar denizaltıların konumlarını belirlemek zorundalar. Bunun için ellerindeki parçalı bilgileri birleştirmeliler.

337 Şimdi, herhangi bir aldatma manevrasının olmayacağını varsayarsak d1'in önceki konumuna göre haritada olacağı konumu belirtiniz. Denizaltının önceki konumu 1'dir. Şimdiki konumu 2'dir. Burada 1-2 arası mesafe yaklaşık 500 deniz milidir ve birbirine yakın iki nokta için de aynı mesafe geçerlidir. Denizaltının sonraki konumu ne olabilir?

338

339 Savaş durumunda gereksiz ve boşa yakıt ve zaman harcamasının olmayacağını, yapılan her işlemin kesinlik ve gereklilik içerdiğini bildiğimize göre (bu noktada halkımızın diline dolanmış olan 'askerliğin başladığı yerde mantık biter' sözünün yalnızca üst-ast ilişkisinde itaat bakımında geçerli olduğunu, ancak askeri operasyonlarda zafer için insan aklının

340 -özelikle günümüzde- son raddede mantıklı sonuçlar üretmesi gerektiğini söylemeliyim) ilk bakışta soru işareti uyandıran konumlar 3 ve 6'dır. Buna göre denizaltı, kesin cevap isteniyorsa 4 veya 5'te, yaklaşık cevap isteniyorsa 4-5 arasında olabilir. Düşmanın manevra ve diğer gemi ve denizaltı sayısı, bunların yönleri dikkate alınarak cevap kesinleştirilebilir.

341 ÖRNEK-3 Uluslararası suç izleme teşkilatı diye bir ortak birim olsun. Ülkeleri incelesinler. Birbirine komşu üç ülke ve aralarındaki ticaret ilişkisi oranları şöyle bilinsin. Her ülkenin başka ülkelerle birlikte bu gruptaki toplam ihracatı için;

342 Ü1 Ü2 için toplam ihracatta %45, Ü3 " " " %35, Ü2 Ü1 için toplam ihracatta %55, Ü3 " " " %15, Ü3 Ü1 için toplam ihracatta %40, Ü2 " " " %30

343 Oranlarında payları bulunuyor. Suç izleme teşkilatı bir dönemde Ü3'ün oranlarının Ü1 için %35, Ü2 için %26 olduğunu belirlesin. Teşkilat bunun nedenlerin doğal afet veya global veya bölgesel mali kriz olmadığını tespit etsin. Ayrıntılı araştırmalar sonucunda Ü3'ün açığı uyuşturucu madde ticareti ile kapattığını bulur.

344 Şüpheye yol açan istatistiki veri ise; uydulardan ve yerden gözlendiği kadarıyla Ü3'ün başka ülkelerle olan taşıt trafiğinin başka zamanlardaki istatistiklere uymamasıdır. İstatistik; insan davranışlarını modelleyebilir. Bireyin bile hayatındaki olguları, özelliklerinin yol açabileceği sonuçları gibi bilgiler bilindiğinde, d durumu için d1,...,dn seçenek durumlarından kesinliğe yakın olanları bulunabilir.

345 Sonra dx durumu için dxn alt seçenekleri bulunur. Bu şekilde eylem için son hesaplanabilir. Burada kuantum belirsizlikleri gibi görünen birey davranışları istatistik ile belirli aralıklarda öngörülebilir. Bence kuantum ölçeğinde parçacığın bulunma olasılığı olan bölge ile parçacığın konumu arasında bir ilişki olması gerekiyor,

346 buna göre aslında kişi, topluluk ve ülkelerin de sırasıyla hareketleri öngörülebilir.Örneklerden 2.si denizaltı yerini tahmin etme durumu, II.dünya savaşında ve günümüzün savaşlarında kullanılmış olabilir. Örnekte göründüğünden çok daha karmaşık hale getirilebilir. Yer tahmininde istatistiki metodlar astronomiye dek uzanan kullanım alanlarına sahip olabilir.

347 Bütün iş verileri toparlayıp bir düzen aramaktır. İstatistik metodlar, mühendislik olgu ve sosyal olayların incelenip sonuç alınmasında bazı ülkelerde yoğun olarak kullanılmaktadır. Türkiye'de de gelecekte gelişecek en önemli araştırma sahalarından biri olacaktır. Kültürlü, kendini yetiştirmiş, nitelikli istatistikçilere ihtiyacımız olacak.

348 11.HİSTOGRAM Tekrarlı sayılardan oluşan elimizdeki verileri, uygulanan işlemlerden sonra önce tabloya, tablodan yararlanarak grafiğe aktarılması yani veri gruplarının grafiğinin dikdörtgen sütunlar halinde gösterilmesine histogram denir.

349 Verilen bir soruda histogramı oluşturup çizmek için şu aşamalar takip edilir: 1) Önce veriler küçükten büyüğe sıralanır. 2) Veri grubunun açıklık değeri bulunur. Açıklık değeri bulunurken en büyük sayıdan en küçük sayı çıkartılır.

350 3) Kaç grup oluşturmak istiyorsak grup sayısı belirlenir.Grup sayısını kendimiz belirlemek istersek veri sayısının karekökü alınır.Bu kuralda grup sayısı 10'dan az çıkabilir ve daha sağlıklı olur.(Bu ifade MEB öğretmen kılavuz kitabından alınmıştır.

351 4) Veri grubunun genişliği bulunur.Genişlik bulunurken açıklık değeri grup sayısına bölünür.Genişlik en yakın büyük tam sayı veya en yakın büyük tek sayı olarak alınabilir.Yayınlanan iki farklı kitapta çelişkili ifadeler göze çarpıyor.Paniğe kapılmayın.Soruların %95'inde en yakın büyük tek sayıya yuvarlanmış. SBS sınavında karışık ve çelişkili soru gelmez.

352 2009 A kitapçığı Sbs matematik sorularından 18. soruyu incelediğimizde genişlik 6,6 çıkmıştır. 7'ye yuvarlanmıştır. Soru gayet açık ve nettir.Bölme işlemindeki bölüm; a) 9 gibi tek tam sayı çıkarsa aynen 9'u alırız. (Bu ifade geçen seneki Aydın Yayınları çalışma kitabı sayfa 9'daki 7.sorudan alınmıştır.)

353 b) 4 gibi çift tam sayı çıkarsa bir üstündeki tek sayıyı yani 5'i alırız. (Bu ifade MEB öğretmen kılavuz kitabından alınmıştır.) c) 4,8 gibi çıkarsa bir üstündeki tek sayıyı yani 5'i alırız. d) 2,1 gibi çıkarsa bir üstünde tek sayıyı yani 3'ü alırız. e) 3,5 gibi çıkarsa en yakın tek sayıyı yani 3'ü alırız. (Bu ifade MEB öğretmen kılavuz kitabından alınmıştır.)

354 f) 3,7 çıkarsa en yakın tam sayıyı yani 4'ü alırız. (Bu ifade MEB öğretmen kılavuz kitabından alınmıştır.) g) 7,2 gibi çıkarsa en yakın tek sayıyı yani 7'yi alırız. h) 3,86 çıkarsa en yakın tam sayıyı yani 4'ü alırız.(MEB ders kitabı sayfa 37'deki 6.soruda ilk veri 121,son veri 152 olduğu için açıklık =31 çıkmıştır.)

355 5) Verilerimizi ilk sayısından başlayarak genişlik kadar sayıları devam ettiririz.Örneğin ilk sayımız 18, veri grubu genişliği de 5 ise 18,19,20,21,22 diye belirledikten sonra 18-22,23-27,28-32 diyerek devam edecek.En son verimizde bitinceye kadar böyle ikili gruplar oluştururuz. 6) Oluşturduğumuz grupları ve karşısındaki veri sayılarını tabloya aktarırız.

356 7) Tabloya bakarak verilerin histogram grafiğini çizeriz. Veri gruplarının genişliğinin küçük olması dağılımı daha iyi anlatan histogramlar oluşturur. Genişlik azaldıkça grafik görsel yönden daha iyi anlaşılır. Histogramdaki zikzaklar o aralıkta hiç veri olmadığını gösterir.

357 NOT: Bu kadar grup genişliği ile ilgili çelişkili ifadeyi ortadan kaldırmak için en iyisi bir üstündeki tam sayıyı almaktır.Tam sayı çıksa da bir üstündeki tam sayıyı, ondalık kesir çıksa da bir üstündeki tam sayıyı alınız.Bu tam sayı tekte olabilir,çiftte olabilir.Şunu unutmayın MEB sbs sınavında çelişkili soru sormaz.

358 ÖRNEK Bir sınıftaki 20 öğrencinin boyları verilmiştir. Bu verileri sıralayalım; 142,143,145,145,147,148,155,155,156,160, 162,163,163,167,169,169,170,170,172,175 histogramını oluşturacağız. Önce veri grubunun açıklık değerini hesaplayalım: =33

359 Veri gruplarının sayısı 4 olsun. Açıklık değerini grup sayısına bölerek veri grubunun genişliğini bulacağız: 33/4=8,25 8,25 bundan büyük olan tek sayıyı yani 9'u alacağız. Genişlik 9'dur. Şimdi tablo oluşturacağız.

360 Bu değerleri grafiğe aktarıp sütunlar çizeceğiz. Grafikte dikey eksen kişi sayısını, yatay eksen boy uzunluklarını gösterecek. Sonuç olarak sütunlardan oluşan grafiğimiz histogramdır. BOY UZUNLUKLARIKİŞİ SAYISI

361 12.MATEMATİK İSTATİSTİK VE GÜVENİLİRLİK

362 12.1.ÇEVREMİZDEKİ İSTATİSTİKLER Her ayın 3. günü açıklanan, bir önceki ayın enflasyon oranları, Borsa endeksinin her gün aldığı yön ve değer, Ekonominin yıllık büyüme hızı, Ortalama ücretlerdeki artış, İthalat ve ihracattaki gelişmeler, Gelir dağılımındaki dengesizliğin boyutları,

363 Kentlerdeki gecekondulaşma hızı, Gazetelerin satış rakamları, Televizyon kanallarının izlenme oranları, Kamuoyu yoklamaları, Maç sonlarındaki oyun istatistikleri, vb…

364 12.2.MATEMATİKSEL İSTATİSTİK VE OLASILIK  Permütasyon (Sıradüzen),  Kombinasyon

365 PERMÜTASYON İnsanlar, nesnelerin değişik düzenlerde sıralanma sayısının bulunmasına ilişkin sorularla ilgilenmişlerdir. Örneğin; 12 kişi bir sıraya kaç farklı düzende oturabilir, 8 kişi bir sinema gişesi önünde kaç farklı düzende sıralanabilir gibi. Olasılıkların incelenmesinde de buna benzer soruların yanıtlanmasına gerek olacağından, öncelikle permütasyon konusunu inceleyelim.

366 n tane nesneyi sıralama, belirli bir sırada düzenleme ilgi alanımıza giriyorsa, olası düzenlemelerin tümüne sıradüzen (permütasyon) adı verilir. Örneğin; A, B ve C harfleri ile adlandırılan üç kitabın bir rafa kaç farklı düzende sıralanabileceğini belirlemek isteyelim. Bu soruya cevap iki farklı şekilde verilebilir.

367 I. yol; Ağaç diyagramından yararlanmaktır. Ağaç diyagramında değişik düzenlerin sayısı, yani sıra düzenlerin sayısı şu şekilde elde edilir.

368 1.gözdeki 2.gözdeki 3.gözdeki Olası kitap kitap kitap düzenler B CABC A C BACB A CBAC OB C ABCA A BCAB C B ACBA

369 II.yol Biçimindeki gözelerin doldurulmasına dayanmaktadır. Birinci göze; A, B ve C kitaplarından biri ile, yani 3 değişik yolla doldurulabilir. 3 Birinci Gözeye konabilecek kitabın her biri için ikinci göze; geriye kalan iki kitaptan biri ya da öteki ile doldurulabilir.

370 3 2Üçüncü göze de geriye kalan bir kitap ile doldurulabilir Böylece üç kitabın değişik düzen sayısı =6 olarak bulunur.

371 ÇARPMA İLKESİ n1 yolda ortaya çıkan bir olay düşünelim. Bunu izleyen ikinci olay, n1 yolun her biri için n2 yolda ortaya çıksın. Bu durumda tüm olayın değişik biçimde ortaya çıkma sayısı n1.n2 olur. Bu durumu birbirini izleyen k olay için genelleyecek olursak: i olayı ni yolda yapılabilsin. k olayın tümü birlikte n1.n nk değişik yolda meydana gelebilir.

372 ÖRNEK 1, 2, 3, 4, 5 rakamları ile hiçbir rakamı tekrarlamadan üç rakamlı kaç farklı sayı yazılabilir? Doldurulacak 3 göze vardır. İlk göze, beş rakamın herhangi biri (1, 2, 3, 4, 5) ile yani beş farklı şekilde doldurulabilir. İkinci göze, geriye kalan dört rakamın herhangi biri ile yani dört farklı şekilde doldurulabilir.

373 Son göze yani üçüncü göze, geriye kalan üç rakamdan bir ile yani üç farklı şekilde doldurulabilir. Çarpma ilkesine göre, oluşturulabilecek üç basamaklı sayıların toplam sayısı; = 60 olur.

374 TOPLAMA İLKESİ Birincisi n1 farklı şekilde, ikincisi n2 farklı şekilde yapılabilen iki işlemi göz önüne alalım. İki işlemden ancak birinden biri yapılabilirse, bu işlemlerden bir ya da öteki (n1 + n2) yolda yapılabilir. Toplama ilkesi, sonlu sayıda işlemi içine alan durumlar için de genellenebilir.

375 Örneğin bir öğrencinin sabah dersleri için Üniversiteye ulaşımda kullanacağı seçenekler: 3 farklı servis aracı, iki farklı arkadaşın otomobili, Babasının veya bir komşunun otomobili olsun. Bu öğrenci o sabah Üniversiteye kaç farklı yolla ulaşabilir? Cevap: 3+2+2=7 olur.

376 N FAKTÖRİYEL( N !) 1’den n’ye kadar tüm tamsayıların çarpımına n faktöriyel denir ve n! ile gösterilir. n! = n = n(n-1) ! = 1 ve 1! = 1’dir. n büyüdükçe, n!’li bulmak güçleşir. Bu durumda Stirling formülü kullanılarak n! Yaklaşık olarak bulunur.

377 TEOREM 1 n tane birbirinden farklı nesnenin n tanesi sıralandığında elde edilecek değişik düzen sayısı n!’dır. n tane farklı nesnenin sıralanmasından elde edilen düzenlerin sayısı nPn= n! ile gösterilir. Buna göre, nPn=n! Olur.

378 ÖRNEK 7 kişi bir gişe önünde kaç farklı düzende sıralanabilir? 7P7=7!=7.6…..1= kişinin farklı düzende sıralanma sayısı

379 TEOREM 2 n tane farklı nesnenin (nesneler sıralamalarda yalnız bir kez kullanılabilecek) k (k ≤ n) tanesi sıralanırsa, elde edilecek farklı düzenlerin sayısı nPk= n! İle gösterilir (n-k)! venPk= n!=n(n-1)n(n-2)…(n-k+1) (n-k)! olarak bulunur.

380 ÖRNEK ORHAN sözcüğünün harflerinden iki harfli kaç farklı sözcük yapılabilir? Beş harften ikisini seçip iki harfli sözcükler oluşturacağız. Sözcüklerde harflerin sırası önemlidir. İki harfli sözcüklerin sayısı, n=5 ve k=2 olmak üzere 5P2= 5! = 5 = 5.4.3! = 5.4 =20 olur. (5-2)! 3! 3!

381 Şimdiye dek birbirinden farklı nesnelerin düzenlerinin sayısı incelendi. Eğer nesnelerin bazıları aynı ise, bu durumda düzenlerin sayısını bulmak için değişik işlem yapmamız gerekecektir. Örneğin; 1, 2, 3, 4 rakamlarını Bir kez kullanılmak koşuluyla 4 rakamlı 24= (4!) sayı elde edebiliriz. 4, 4, 4, 4 gibi her biri aynı rakam olduğunda ise 4 rakamlı sadece bir sayı elde edebiliriz.

382 KOMBİNASYON Permütasyonda sıra önemli iken kombinasyonda sıra önemli değil, seçim önemlidir. Dolayısıyla permütasyon (sıradüzen) sayısı ile kombinasyon (birleşim) sayısı eşit değildir. Örneğin; A, B ve C ile gösterilen üç nesneden iki tanesini, sırayı göz önüne almadan, seçmek istersek AB, AC, BC gibi üç farklı seçim yapılabilir

383 Burada nesnelerin sırasını dikkate almadığımız için AB ile BA aynı seçimlerdir. Üç nesnenin ikişerli sıralanmasından elde edilecek farklı düzen sayılarını bulmak istersek burada sıralama önemli olduğundan permütasyon yardımıyla, 3P2= 3! = 3! = 6 (3-2)!

384 PERMÜTASYONLARKOMBİNASYONLAR AB,BAAB AC,CAAC BC,CBBC

385 İKİ TERİMLİ (BİNOM) KATSAYILAR! n artı değerli bir tamsayı iken (x+y) gibi iki terimli bir ifadenin açılımları: (x+y)2 = x2+ 2xy+ y2 (x+y)3= x3 + 3x2y +3xy2 +y3 (x+y)4 = x4 + 4x3y + 6x2y2 + 4xy3 +y4’tür.

386 Her açılımda (üs+1) sayıda terim vardır. Örneğin (x+y)4 açılımında terim sayısı 4+1=5’tir. Ancak üs büyüdükçe açılımı bulmak güçleşir. Bu durumda Binom teoreminden yararlanılır.

387 ÇOK TERİMLİ (MULTINOMIAL) KATSAYILAR n= n n1,..nr n1!..nr! oranından yararlanarak (x1+x2+...xr)n teriminin açılımındaki X1n1..xrnr teriminin çok terimli katsayısı n!olur. n1!n2!..nr!

388 ÖRNEK (x1+x2+x3)6’nın açılımındaki x13x2x32 teriminin katsayısı kaçtır? n=6, n1=3 n2=1 n3=2 olduğuna göre 6! = ! = 60 olur. 3!1!2! 3!.1.2

389 ÖRNEK (x+y+z)8’in açılımındaki x2y3z3 teriminin katsayısını bulunuz? n=8 n1=2 n2=3 n3=3 8!= ! = 560 2!.3!.3! 2.6.3!

390 TEOREM n pozitif değerli bir tamsayı olmak üzere (x+y)n= n xn-r yr ‘dir.Burada (x+y)n açılırsa, r xn-r yr teriminin katsayısı, y’leri veren r tane çarpanın seçebileceği yol sayısıdır.

391 13.ARAŞTIRMA, İSTATİSTİK VE YÖNETİM Araştırma, istatistik ve yönetim kavramları, insanın tarihi kadar eski olmakla birlikte, bunların bir arada kullanılması çok eski sayılmaz. Yönetim ve benzeri tüm faaliyetlerini yerine getirirken, dikkate alması gereken iki önemli kavram olan araştırma ve istatistik bu yazının konusudur. Araştırma ile ilgili temel bazı bilgiler ile istatistiksel gelişim hakkında açıklama yapılacaktır.

392 Araştırma, çoğunlukla yalnızca gözlem yapma, bilgi ve veri toplama anlamında ifade edilir. Bu tanım, yanlış olmamakla birlikte eksik bir bakış açısıdır. Bir araştırmada, bilgilerin toplanması tabii ki söz konusudur. Ancak araştırmacı gözlemlerini yeniden gözden geçirerek, analiz etmeli ve tartışarak yorumlamalı, değerlendirmeli ve anlamlı bilgiler haline getirmelidir.

393 Bu yönüyle araştırma, çok daha karmaşık ve detaylı bir uğraştır. Araştırmada, insanlığın yararına yönelik olarak, kişinin ve toplumun karşılaştığı problemleri çözme, insanlığın hizmetine ve kullanımına yeni araçlar kazandırma gibi amaçlar bulunur. Buna göre araştırma, gelişmeyi sağlama ve yararlanabilme, problemleri çözmek amacıyla başvurabileceği önemli bir yaklaşımdır.

394 Araştırmalar, bilime katkıda bulunarak, problemlere çözüm getirip, toplum ve ülke yararına alınacak kararlara yol göstererek, insanlığın bilgi ve kültür birikimini zenginleştirecek şekilde yapılmalıdır. Araştırma bu derecede önemli bir çalışma olduğunda, onun sonuçlarının da o derecede güvenilir olması gerekmektedir.

395 Bunu sağlayacak olan ise yapılacak çalışmalarda, amaçları gerçekleştirecek en uygun yöntem ve tekniklerin kullanılmasıdır. Böylece, araştırma bir bilgi kazanma aracı olarak, bilginin üretilmesine yardımcı olurken, aynı zamanda bilimin gelişmesine ve oluşmasına da katkıda bulmaktadır. Araştırmada aranan bazı özellikler söz konusudur.

396 Bu özellikler ise şöyle sıralanabilirler: Araştırma, olgusal ve kuramsaldır, gözlemseldir, sistematiktir, mantıksaldır, yöntem olarak işlevseldir, hipoteze dayalıdır, sosyal bir etkinliktir, dinamiktir ve doğruluk yapısına sahip olmalıdır. Bu özelliklerinin yanında araştırmada gerçekleşmesi istenen amaçlar genel olarak; açıklama, kestirim ve kontrol gibi üç grupta toplanabilir.

397 Araştırmanın çeşit ve yöntemlerinde ise tam bir görüş birliği bulunmamaktadır. Bununla birlikte, araştırma yöntemleri; amaca, kullanılan veri toplama ve analiz yöntemlerine, değişkenleri kontrol edebilme derecesine, verilerin kaynaklarına, çevresine, düzeyine ve zamana göre adlandırılabilir veya gruplandırılabilmektedir.

398 Araştırmaya başlamadan önce izlenebilecek yola ait bir plan yapılmalıdır. Kabaca bu planlamaya araştırma önerisi adı verilir. Burada bir model geliştirilmelidir. Bu model, araştırma sürecinde kılavuzluk görevi yapacaktır. Ancak bu planlama her araştırma için bazı farklılıklar gösterebilir. Araştırmacının hazırlamış olduğu projenin uygulanabilir olup olmadığını, araştırmanın öneri

399 taslağında ilerleyip ilerlemeyeceği sorusunun cevabı ile bu modelde anlaşılabilir olacaktır. Planlama yapmak, araştırmanın yürütülmesinden daha fazla bir dikkat istemekle beraber bu planın anlaşılır ve uygulanabilir olmalıdır. Bir araştırma önerisi, düzen olarak belli bir modele ve biçime sahip, başkaları tarafından anlaşılacak şekilde açık ve eksiksiz yazılmalıdır.

400 Bir araştırmada çeşitli hatalar yer almış olabilir. Burada hata olarak ifade edilen noktalar, araştırmanın sonuçlarını ve bulguları etkileyen sebeplerdir. Bu hatalar, araştırma sonuçlarının genellenmesi ile ilgili olarak, araştırmacının yanlış genellemeler yapmasına yol açabilirler. Bu hatalardan kimi araştırma modeli ile ilgili olabileceği gibi kimi de başka sebeplerden kaynaklanabilir.

401 Araştırmanın bilimsel olarak nitelenmesinde katkılar sağlayan istatistik ise günümüzde, belirsizlik ortamında, araştırma, tahmin ve karar verme mekanizmaları geliştiren bir bilim dalı olup, aynı zamanda diğer bilim dallarının da teknolojisi olarak kabul edilmektedir. Son çeyrek yüzyıla damgasını vuran ve bu çağın bilgi çağı olarak adlandırılmasına neden olan gelişmeler

402 istatistiği evrensel bir anlaşma dili haline getirmiştir. Bilgi çağı kavramının oluşmasında istatistiğin katkısı büyüktür. Çünkü her türlü yönetim, ulusal ve uluslararası sosyal-ekonomik ve diğer gelişme hedeflerinin belirlenmesi ve bu hedeflerin başarısı, güncel ve güvenilir istatistiksel çalışmalara dayandırılmasına bağlıdır.

403 Bugün, doğru bilgi, doğru yorum ve doğru karar alma sürecinde; araştırmacılar, politikacılar, yöneticiler ve tüm bireyler çalışmalarında ve güncel hayatlarında istatistiksel bilgileri, bilerek ya da bilmeyerek etkin olarak kullanmaktadırlar.Şimdi öncelikle, eski zamanlardan başlayarak istatistiğin gelişimine bakmakta fayda vardır.

404 Veri derlemeye dayanan istatistik uygulamasının tarihçesine bakılacak olursa, istatistik, MÖ 3000'li yıllara kadar uzanan bir geçmişe sahiptir. Nüfus, arazi ve ekonomik gibi bazı olaylar bakımından bilgi sahibi olmadan devletin yönetimi zor olacağından, istatistik uygulamasının devlet kadar eski olduğunu söylenebilir.

405 Milattan önceki yüzyıllarda, Mısır’da, Roma’da ve Çin’de nüfus ve arazi sayımları yapıldığı çeşitli kaynaklardan bilinmektedir. Bu tür çalışmalar yüzyıllar içerisinde periyodik olarak yapıla gelmiştir. Daha yakın zamana gelinecek olursa, 17. Yüzyılda Fransa’da Colbert zamanında maliye ve dış ticaret istatistikleri derlenmeye başlanmıştır.

406 1790 tarihinden başlayarak ABD’de genel nüfus sayımları yapılmaktadır. Bir bilim dalı olarak istatistiğin tarihçesine ilişkin gelişme de ide iki farklı bakış açısı söz konusudur. Bunlardan ilki, H.Conring ( ) ve G.Achenwall ( )’nin başlattığı betimsel (tasviri) istatistiktir.

407 İkincisi ise analize dayanan istatistik olarak nitelendirilmekte olup, bunların ilk başlatıcılarına sigorta matematikçileri ve nüfusçular denmektedir. Bu akım, 17. Yüzyıldan itibaren birinci akımdan bağımsız olarak İngiltere’de doğmuştur. Bunların ilk başlatıcısı J.Graunt ( )’dır.

408 Geçen iki yüzyıldan, günümüze kadar istatistik kuramsal yönden önemli gelişmeler sağlayarak uygulama alanı hızla gelişen bir bilim dalı haline gelmiştir. Bu çerçevede yaptıkları çalışmalar ile K.Pearson ve R.A.Fisher önemli isimler olarak kabul edilmektedir. Son yıllık zaman dilimi içerisinde yönetim, iktisat,

409 finans, sağlık bilimleri, sosyoloji, psikoloji, mühendislik, ziraat, fizik, biyoloji, meteoroloji ve deprem gibi daha bir çok konuda uygulaması olmak üzere kuramsal açıdan da yeni gelişmeler sağlanmıştır. Bu noktada istatistik, aynı zamanda bilimsel araştırmanın temeli haline geldiğini söylemek ise yanlış bir ifade değildir.

410 Ülkemizde istatistik uygulaması ise oldukça eskidir. Selçukluların ve ilhanlıların nüfus bilgilerine önem verdikleri kayıtlarla bilinmektedir. Osmanlı imparatorluğunda bazı yıllarda çeşitli konularda sayımlar yapıldığı ve 1389’da kurulan Defterhane’de, bu kayıtların tutulduğu belgelerden bilinmektedir.

411 Osmanlı yönetiminin modern istatistik bilgi ve yöntemlerden yararlanma isteği 19. yüzyılda reform süreci ile başlamış olup, 1830 tarihli nüfus sayımı bunun ilk örneğidir. Bununla birlikte aynı yüzyılın başından itibaren merkezi sisteme dayalı olarak bazı yerlerde istatistik büroları açılmıştır.

412 Bilimsel temellere dayanan ve modern anlamda istatistik hizmetlerinin yürütülmesi 1926’da Başbakanlığa bağlı Merkezi İstatistik Dairesi adıyla kurulmuştur. Cumhuriyet döneminde 1933 yılında İstatistik Umum Müdürlüğü kurulmuş ve resmi verilerin toplanması görevini üstlenmiştir.

413 Daha sonra İstatistik Genel Müdürlüğü adını alan bu kuruluş 13 haziran 1962 tarih ve 53 sayılı kanun ile Başbakanlığa bağlı Devlet İstatistik Enstitüsü (DİE) olarak yeniden teşkilatlanmıştır. DİE, ülkenin sosyal, ekonomik ve sağlık gibi verilerini toplama ve yayınlama görevini üstlenmiştir.

414 Daha sonraki gelişmeler çerçevesinde, 1984 yılında 219 sayılı Kanun Hükmünde Kararname ile yeniden yapılandırılmış olan DİE, son olarak 2005 yılında, 5429 Sayılı Türkiye İstatistik Kanunu ile Türkiye İstatistik Kurumu (TÜİK) adını alarak kurulmuştur. Türkiye İstatistik Kurumu; İstatistik Konseyi ve Türkiye İstatistik Kurumu Başkanlığından oluşmuştur.

415 Bugün kamu sektöründe TÜİK’in yanında resmi istatistik çalışmalarının yapıldığı başka kurumlar da söz konusudur. Başta bütün bakanlıkların olmak üzere en büyüğünden en küçüğüne kadar istatistik dairesi, şubesi veya birimi olmayan kamu kuruluşu neredeyse yok gibidir. Ancak son kanunla beraber koordinasyona yönelik ilerlemeler sağlanmıştır.

416 İstatistik eğitim ve öğretimine bakılacak olursa, dünyada üniversite düzeyinde istatistik eğitimi 20.yüzyılın başlarına kadar uzandığı bilinmektedir. İlk zamanlar istatistik, bazı branşlarda servis dersi olarak, daha sonra ise bağımsız bir bölüm olarak eğitim ve öğretimde yerini almıştır.

417 Gelişmiş ülkelerde var olan bu köklü yapılaşmasının yanında, ülkemizde istatistik bir ders olarak, 1933 yılında üniversitelerimizin iktisat fakültelerinde verilmeye başlatılmıştır. İstatistik öğretimi daha sonra sağlık, fen ve sosyal bilimlerde hızlı bir şekilde yayılmıştır. Öncelikle 1960’lı yılların başında lisans üstü düzeyinde eğitim ve öğretime başlanılmıştır.

418 Aynı yıllarda AİTİA gibi diğer bazı eğitim kurumlarının yanı sıra bu konuda öncü rolünde olan DİE’de istatistik sertifika programı başlatılmıştır. Lisans düzeyinde ilk bölüm ise 1967 yılında Hacettepe Üniversitesi’nde kurulmuştur. Bunu sırasıyla ODTÜ, Gazi Üniversitesi ve diğerleri izlemiştir.

419 Gelişmiş ülkelerde hassas bilgiye verilen önem, hassas bilgiye olan ihtiyaçtandır. Hassas bilgiye ihtiyacınız yok ise veya yöneticiler ya da karar alıcılar yapacaklarını doğru bilgiye göre değil de başka ölçütlere dayandırıyorlarsa böyle ülkelerde ve toplumlarda sıkıntılar yaşanabilmektedir.

420 Çeşitli zamanlarda ülkemizde bu ikilemin var olduğunu söylemek her halde zor olmasa gerek. İstatistikleri gizlenen veya yanıltıcı bir şekilde kamu oyuna sunulan ülkelerin ekonomileri ve diğer kurumlarıyla beraber yönetimlerin ne tür çıkmaza girdikleri geçmişte örnekleriyle görülmüştür.

421 Bugün ülkemizde kamu sektöründe resmi istatistikleri üreten TÜİK’in geçmişten bugüne oldukça mesafe aldığı söylenebilir. Eğer bilimsel yeterlilik ve bilgi düzeyi göz önünde tutulursa, bu durum gelişerek devam edebilecektir. Fakat iş TÜİK’in sağlıklı veri üretmesiyle bitmemektedir. Önemli olan o göstergelerin yönetimler ya da karar vericiler tarafından önemsenerek dikkate alınmasıdır.

422 Aslında özel sektörde istatistiksel çalışmaların istisnalar dışında önemsendiğini, üretimde ileri kaliteye ulaşmak için yapılan çalışmalarda istatistiksel anlayışın kabul gördüğü söylenebilir. Ancak, bazı kamuoyu araştırmalarının sonuçlarına zaman zaman kuşkuyla yaklaşıldığı ise bilinmektedir.

423 Bunun dışında, bugün özellikle akademik araştırmalarda istatistiksel değerlendirmenin önemsendiği söylenebilir. Bu çerçevede istatistik çoğu konularda ortak bir anlatım dili olarak varlığını hissettirmektedir. Yukarıda da ifade edildiği gibi, bir bilim dalı olarak istatistik aynı zamanda diğer bilim dallarının teknolojisi olduğu ve araştırmayla

424 beraber gelecekte de önemini yitirmeyeceği ve gelişmişlik düzeyi arttıkça bunun daha da belirginleşeceği söylenebilir. Avrupa Birliği Sürecinde müzakere konu başlıklarından birinin de İstatistik olması bu konudaki önemli göstergelerden biridir. Buna paralel olarak, ülkemizde sorumluların, gelişmiş ülkeler çerçevesinde önemserse, geleceğin daha güzel olabileceği aşikardır.

425 İfade edilen güzelliklere sahip olabilmek için, araştırma ve istatistiksel yaklaşımın artarak kullanılmasıyla, Türkiye’nin, ekonomi, sağlık, güvenlik, eğitim ve benzeri tüm sektörlerine çok daha önemli katkılarının olacağı ise açık bir gerçektir.

426 KAYNAKLAR Prof. Dr. Ali Şen


"İSTATİSTİK BİLİMİ. İÇİNDEKİLER 1.İSTATİSTİK………………………………………………….23 1.1. İSTATİSTİK KELİMESİNİN ANLAMI………………...24 1.2.İSTATİSTİĞİN TANIMI………………………………….35." indir ppt

Benzer bir sunumlar


Google Reklamları