ZAMAN SERİLERİ MADENCİLİĞİ KULLANILARAK NÜFUS ARTIŞI TAHMİN UYGULAMASI

Slides:



Advertisements
Benzer bir sunumlar
  5.4 PROJE TRAFİĞİ Kırsal yolların tasarımı ile ilgili geometrik standartların seçimine esas olan trafik için genelde 20 sene sonraki trafik değeri alınır.
Advertisements

GRAFİK VE HARİTA YARATMA
Diferansiyel Sürüş Sistemi E-posta:
ALPER LAÇİN SERDAR TAŞAN
MERKEZİ YIĞILMA (EĞİLİM) ÖLÇÜLERİ
Yrd.Doç.Dr.Levent Malgaca,2010
Asansör Simülatörünün Ürettiği Sonuçlar Üzerinde Yapılan K-means++ Kümeleme Çalışması ile Trafik Türünün Tahmini M. Fatih ADAK Bilgisayar Mühendisliği.
WEB OF SCIENCE İLE ATIF TABANLI ARAŞTIRMA DEĞERLENDİRMESİ Eğitmen: Metin TUNÇ This presentation is an introduction to InCites - the new web-based.
Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı
MIT563 Yapay Zeka ve Makine Öğrenmesi
İŞARET DİLİ.
Yeditepe Üniversitesi Hastanesi/ İş Geliştirme Yöneticisi
İstatistiksel Sınıflandırma
Kalp-Damar Sistemi Hastalıkları Hakkında Bilgi
SAYAÇ İZLEME VE DENETLEME SİSTEMLERİ.
Karayolu Ulaşım Güvenliğinde
Kümeleme ve Yöntemleri Arş.Grv İlyas AKKUŞ İnönü Üniversitesi B.Ö.T.E
Süleyman Demirel Üniversitesi Sosyal Bilimler Enstitüsü
Bilişim Sistemleri Mühendisliği nedir? Neden ihtiyaç vardır?
Yrd. Doç. Dr. Ayhan Demiriz
BM-103 Programlamaya Giriş Güz 2014 (8. Sunu)
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
Yapay Zeka Teknikleriyle Tıbbi Verilerin İşlenmesi: VERİ MADENCİLİĞİ
EXCEL’DE GRAFİK OLUŞTURMA
C# Veri Tipleri ve Değişkenler
ÖNGÖRÜMLEME (Forecasting)
Makİne Öğrenmesİ İle Ürün SInIflandIrma İncelemesi
İNTERNET’TE ALIŞVERİŞİN KENTİN EKONOMİK VE FİZİKSEL DEĞİŞİM VE DÖNÜŞÜMÜNE KATKISI Yrd. Doç. Dr. K. Mert Çubukçu Dokuz Eylül Üniversitesi Mimarlık Fakültesi.
Makine Öğrenmesinde Yeni Problemler
WEB SUNUCU LOGLARININ WEB MADENCİLİĞİ YÖNTEMLERİ İLE ANALİZİ
Microsoft Office Access
Yrd. Doç. Dr. Mustafa Akkol
Bilgisayar Entegre Ofis Programları-I Öğr.Gör. Türkan ÖZBAY.
İSTATİKSEL KAVRAMLAR İstatistik Doç. Dr. Şakir GÖRMÜŞ SAÜ| e-FEK.
VERİLERİN TOPLANMASI, DÜZENLENMESİ VE TABLO VE GRAFİKLER YARDIMIYLA SUNUMU İstatistik Doç. Dr. Şakir GÖRMÜŞ SAÜ.
Yrd. Doç. Dr. Murat Olcay Özcan
Sayısal Tanımlayıcı Teknikler
İstatistik Bilimine Giriş
Veri Madenciligi . Sınıflandırma ve Regresyon Ağaçları ( CART )
ÖĞRENME AMAÇLARI Tahmin kavramını anlamak Pazarlama araştırmacılarının regresyon analizinden nasıl faydalandığını öğrenmek Pazarlama araştırmacılarının.
Yapay Zeka Desteği ile Parfüm Öneri Sistemi
Maliye’de SPSS Uygulamaları
Ders İçeriği SPSS’te veri seti oluşturma ve verileri düzenleme
BİL3112 Makine Öğrenimi (Machine Learning)
Maliye’de SPSS Uygulamaları
TÜRKİYE İSTATİSTİK KURUMU İŞGÜCÜ İSTATİSTİKLERİ NASIL HESAPLANIYOR? Enver TAŞTI Daire Başkanı TBMM Plan ve Bütçe Komisyonu Bilgilendirme Toplantısı 06.
Akış Diyagramları - 1. Akış Diyagramı  Algoritmalar doğal dille yazıldıklarında herkes tarafından aynı biçimde anlaşılmayabilir.  Ancak, akış diyagramlarında.
T.C BEYKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ENDÜSTRİ MÜHENDİSLİĞİ A.B.D Optimizasyon Teknikleri – Yrd.Doç.Dr Ümit Terzi Solar Panel Üretimi Yapan.
Bölüm 4 : VERİ MADENCİLİĞİ
Türkiye’de Okun yasasının Geçerliliğinin İncelenmesi: Ekonometrik Bir Analiz Adnan Menderes Üniversitesi Betül Ünal Doç. Dr. Mehmet Mercan.
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
C Programlama Dili Bilgisayar Mühendisliği.
plan modelinin ana öğeleri
VERİLERİN DERLENMESİ VE SUNUMU
ANLAM ÇIKARTICI (KESTİRİMSEL) İSTATİSTİK
Kümeleme ve Regresyon Problemleri için Kolektif Öğrenme
Fen Öğretiminin Genel Amaçları Prof. Dr. Fitnat KAPTAN Arş. Gör. Dr
Servet ÖZMEN Karabük Üniversitesi, Fen Bilimleri Enstitüsü,
Makine Öğrenmesinde Yeni Problemler
Fırat Üniversitesi Mühendislik Fakültesi Elektrik-Elektronik Müh.
Ontoloji Tabanlı Bir Kitap Sorgulama Sistemi Gerçekleştirimi
NİŞANTAŞI ÜNİVERSİTESİ
Yrd. Doç. Dr. Abdullah BAYKAL Konuşmacı : Cengiz Coşkun
Volkan Erol1,2 Yard.Doç.Dr.Aslı Uyar Özkaya1
NİŞANTAŞI ÜNİVERSİTESİ
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
Hastane Bilgi Sistemlerinde Veri Madenciliği
Karar Ağaçları Destekli Vadeli Mevduat Analizi
Sunum transkripti:

ZAMAN SERİLERİ MADENCİLİĞİ KULLANILARAK NÜFUS ARTIŞI TAHMİN UYGULAMASI ARŞ.GÖR.ZEYNEP BEHRİN GÜVEN YRD.DOÇ.DR.TURGAY TUGAY BİLGİN MALTEPE ÜNİVERSİTESİ MÜHENDİSLİK ve DOĞA BİLİMLERİ FAKÜLTESİ YAZILIM MÜHENDİSLİĞİ BÖLÜMÜ

İÇERİK Zaman Serileri Nedir? Kullanım Alanları WEKA Veri Madenciliği Aracı SMOreg Algoritması Türkiye İstatistik Kurumu(TÜİK)Nüfus Veri Seti Veri Setinin Uygun Formata Dönüştürülmesi Tahmin Uygulamasının Çalıştırılması Sonuçlar Sorular

ZAMAN SERİLERİ Zaman değişkeniyle ilişkili bir değişken hakkında, elde edilen gözlem değerlerini zamana göre sıralanmış olarak gösteren serilere “zaman serileri” denir. Zaman serileri gelecekteki operasyonların bir yıldan fazla genelde 5,10,15,20 yıla dayanan uzun dönem planlanmasında ,tahmin edilmesinde kullanılabilen ölçümleri belirlemek için analiz edilmektedir.

ZAMAN SERİLERİ KULLANIM ALANLARI Zaman serileri ile elde edilen tahminler ülke ekonomisinin planlanmasında, ya da işletme bazında üretim planlaması yapılmasında kolaylık sağlar. Bu zaman serileri yıllara göre milli gelirin, istihdamın veya ihracatın kaydettiği gelişme gibi iktisadi zaman serileri olabileceği gibi ,bir mağazanın aylık satışlarını ,mevsimlere göre sıcaklık değerlerini ifade eden işletme meteoroloji konuları ile ilgili seriler de olabilir. Zaman serileri genel olarak “kartezyen koordinatlı” bir grafikle gösterilir . x ekseninde zaman değişkeninin şıkları, y ekseninde ise bu şıklar itibariyle y değişkeninin aldığı değerler yani gözlem değerleri yer alır.

ZAMAN SERİSİ GRAFİĞİ-ÖRNEK

WEKA(wakiato environment for knowledge analysis) Veri Madenciliği uygulaması geliştirme programıdır. WEKA java platformu üzerinde geliştirilmiş açık kodlu bir programdır. İçerisinde pek çok sınıflandırma , regresyon, yapay sinir ağları algoritmaları ve önişleme metotları barındıran bir veri madenciliği aracıdır. Desteklediği temel veri kaynakları metin tabanlı arff,csv,c45,svmlight,libsvm,Xarff formatlarıdır.

SMOreg ALGORİTMASI Bu algoritma, Destek Vektör Makineleri (DVM) yöntemini uygulayarak regresyonu gerçekleştirir. DVM’leri 1960’lı yılların sonunda Vladimir Vapnik ve Alexey Chervonenkis tarafından geliştirilmiş, temel olarak istatiksel öğrenme teorisine dayanan bir makine öğrenmesi yöntemidir. Son zamanlarda DVM, örüntü tanıma, yüz bulma ve tanıma, veri madenciliği gibi alanlarda kullanılmaya başlanmıştır.

VERİ SETİ TUIK’ den edinilen veri seti bölgeler içinde, şehir bazında ve annenin yaş grubuna göre nüfus sayısının tutulduğu bir excel dosyasıdır.

VERİ SETİNİN ARFF FORMATINA DÖNÜŞTÜRÜLMESİ Veri setine verilecek olan isim @relation ile tanımlanır. Değişken isimleri değişkene verilecek ad ve türleri ile birlikte @attribute ile tanımlanır. Veriler ise @data etiketinden sonra, kolonlar virgülle ayrılarak yazılır.

Tahmin algoritmasını ve grafiğini oluşturmamızı sağlayan Forecast sekmesi seçilir. Forecast sekmesinde dosyadaki attribute değerleri olan year ve total görülür. Parametreler kısmındaki time stamp değişkeni kaç yıl sonrasını tahmin etme seçeneği sunar.

TAHMİN GRAFİĞİ

Tahmin Edilen Değerler Sonuçlar Tahmin Edilen Değerler ve Doğruluk Oranları

Sonuçlar TUIK’dan aldığımız veri setine göre;2011 yılı toplam nüfusu 1.237.172 dir. .arff formatına dönüştürülüp , WEKA üzerinde zaman serileri madenciliği uygulanması sonucunda , 2001-2010 yılları arasındaki nüfus verisine göre 2011 yılı nüfus tahmini 1.251.270 dir. WEKA da tahmin edilen değer ile gerçek değer arasında -14.098 fark vardır. Tahminimiz %98.86 oranında doğrudur.

DİNLEDİĞİNİZ İÇİN TEŞEKKÜRLER