VERİ MADENCİLİĞİNE BAKIŞ
İçerik Veri Madenciliği Neden Veri Madenciliği? Veri ve Veri Madenciliğinin Önemi Günümüzde Kullanılan Veri Madenciliğinin Çeşitli İsimleri Veri Madenciliği Nedir?
Neden Veri Madenciliği? Karar verici için verilen kararın doğruluğu, onun yeteneklerine, deneyimine ve bilgi birikimine olduğu kadar sahip olduğu veri kümesinin yeterliliğine de bağlıdır. Doğru karar vermede, verilerin toplanması, tasnif edilmesi, hazırlanması, analiz edilmesi ve doğru yorumlanması çok önemlidir. Ayrıca verilerin incelenmesi ile birlikte ilişkilerin ortaya çıkarılması da doğru karar verme için önemli bir rol oynar.
Neden Veri Madenciliği? Günümüzde karar süreçlerinin karmaşıklaşması ve sayısal olarak daha fazla veriye gereksiniminin ortaya çıkması ile büyük veri tabanlarındaki bilginin işlenmesi oldukça zor olmaya başlamıştır.
Neden Veri Madenciliği? Kurumlar ve işletmeler her kayıtlarını elektronik olarak biriktirmeye başlamış ve sayısal teknolojilerin gelişmesiyle birlikte akıl almaz derecede veri birikimi meydana gelmiştir. Veri tabanlarında ve veri ambarlarında depolanan veri yığınları arasından anlamlı ilişkilerin, kalıpların ve eğilimlerin ortaya çıkartılması ihtiyacı doğmuş, gelecek adına doğru tahminlerin yapılması önem kazanmıştır.
Neden Veri Madenciliği? Veri madenciliği (data mining) uygulamaları işte bu noktada, istatistiksel analiz ve modellemeler ile Makine öğrenimi “artificial intelligence” tekniklerinin kullanılması ile devreye girmiştir. Karmaşık örüntüleri algılama ve veriye dayalı akılcı kararlar verebilme becerisi kazandırmada, veri madenciliği; istatistik, makine öğrenimi, optimizasyon, veri ambarcılığı, uzman sistemler, örüntü tanıma, yapay zekâ, uyarlamalı denetim ve kuramsal bilgisayar bilimi ile ilişkilidir. Verinin içindeki bilginin ortaya çıkarılması için gelişmiş teknolojiler ve iş deneyimi birlikte kullanılmalıdır.
Veri Madenciliği İle İlişkili Alanlar
Neden Veri Madenciliği? Bilimsel veritabanlarının ve ağ sistemlerinin geliştirilmesiyle birlikte bankacılık, finans, ekonomi, sağlık, adli suçlar, güvenlik ve savunma gibi pek çok alanda veri madenciliği teknikleri geliştirilmeye başlanmış, tahmin analizleri, modellemeler ve yapay zekâ teknikleri alanlarında ciddi ilerleme kaydedilmiştir.
Veri ve Veri Madenciliğinin Önemi Günümüzde ekonomik sistemde veri ya da bilgi, mal ya da hizmet üretiminin faktörlerinden birisi olarak algılanmaktadır. Bu ise karar vericileri yanlış karar riskinden uzaklaşabilmek için, mümkün olduğunca fazla veriyi depolamaya zorlamaktadır. Ayrıca internetin yaygınlaşması, rekabetin önemli olması, kar marjlarının düşmesi ve müşteri memnuniyetinin zorlaşması, bu endişeyi daha da artırmaktadır. Bu durum ise doğru veriyi toplama ya da doğru veriye ulaşma zorunluluğunu ortaya çıkarmıştır. Artık veriye erişmek en az verinin kendisi kadar önemli bir faktör olarak karşımıza çıkmıştır.
Veri ve Veri Madenciliğinin Önemi Bilgisayarın yaşamımızda daha çok rol almasıyla, yapılan her işlem sayısal ortamda kayıt altına alınmaya başladı. Hastanelerde, belediyelerde veya ticarette yapılan her işlem artık veritabanlarında yerini almıştır. Hatta bir mağazaya, alışveriş merkezine girerken ya da çıkarken, bazen de yolda yürürken kameraya çekilen görüntüler bile bir veritabanı oluşturmaktadır. Bütün bunlar bir yığın halinde depolanırken içlerinde nasıl gizli bilgiler taşıdığı bilinmemektedir. Tüm bu veriler, veritabanlarında çıkarılmayı bekleyen değerli bir maden gibi durmaktadır. Bir bakıma çevremizde bir sürü veri varken, bu veriler bilgiye dönüşmeyi beklemektedir.
Veri ve Veri Madenciliğinin Önemi Günümüzde şirketlerin müşteri ile ilişkileri büyük ölçüde değişmiştir. İşletmelerde başarılı bir müşteri ilişkileri yönetimiyle, küresel bir dünyada ve giderek artan rekabetçi piyasalarda, işletmeler için yaşamsal önem taşıyan, müşteri için değer yaratmak, müşteri sadakati sağlamak ve bu konularda kurumsallaşmayı gerçekleştirmek mümkün olabilecektir.
Günümüzde Kullanılan Veri Madenciliğinin Çeşitli İsimleri Veri Madenciliği (Data mining) Veritabanlarında bilgi madenciliği (knowledge mining from databases), Bilgi çıkarımı (knowledge extraction), Veri ve örüntü analizi (data/pattern analysis), Veri arkeolojisi gibi, İş analitikleri (Business analytics)
Veri Madenciliği Nedir? Literatürde veri madenciliğine ilişkin bir çok tanım yapılmıştır. Bunlardan bazıları aşağıda verilmiştir. Veri madenciliği, veri ambarlarında tutulan çok çeşitli verilere dayanarak daha önce keşfedilmemiş verileri ortaya çıkarmak, bunlara karar vermek ve gerçekleştirmek için kullanma sürecidir. Anlamsız görünen veri yığını üzerinde birçok işlem yapılarak önemli ve anlamlı bilgilerin çıkarımına olanak sağlama sürecidir. Mevcut veri yığınları arasından anlamlı ilişkilerin, kalıpların ve eğilimlerin ortaya çıkartılmasıdır.
Veri Madenciliği Nedir? Veri madenciliği, önceden bilinmeyen ilişki ve eğilimlerin bulunması için bugünün endüstrisinde yaratılan büyük miktarlardaki veriyi analiz eden bir yoldur. Veri madenciliği büyük ve karmaşık verilerde beklenmeyen patikaların, değerli yapıların ve ilginç ilişkilerin keşfedilmesi bilimidir. Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır.
Veri Tabanlarında Bilgi Keşfi Süreci HAN, J., KAMBER, M., PEI, J., “Data Mining Consepts And Techniques”, Morgan Kaufmann, USA, 2012, s.7.
Veri Madenciliğinde Kullanılan Yöntemler Veri madenciliği yöntemleri işlevlerine göre aşağıdaki gibi üç temel grupta tanımlanmaktadır. Sınıflama (Classification), Kümeleme (Clustering), Birliktelik kuralları ve sıralı örüntülerdir (Association rules and sequential patterns).
Referanslar Berry M, Linoff G., “Data Mining Techniques For Marketing, Sales And Customer Support”, John Wiley & Sons , New Jersey, U.S.A, 1997. Dasu, T. ve Johnson, T. (2003) Explarotary Data Mining and Data Cleaning. Ganesh, S. (2002) “Data Mining: Should it be included in the ‘Statistics’ cirriculum?”, The Sixt International Conference on Teaching Statistics, Cape Town, South Africa, 7–12 July. Gürsakal N., (2006), Sözcük ve Sayı, SPSS Kamu Günü, 14 Nisan, 2006. SPSS Veri Madenciliği Çözümleri. Han J., Kamber M., Pei J. (2012), Data Mining, Concept and Techniques, Elsevier.