Veri Madenciliği

Uzun olmayan bir zaman öncesine kadar karar vericilerin, yöneticilerin karşılaştığı temel problemlerden biri olarak görülen veri kıtlığı, enformasyon yetersizliği yerini aşırı bolluğa bırakmıştır. Enformasyona erişim endişesinin yerini artık erişebilinen miktarla başa çıkma endişesi almıştır[1]. Günümüz modern insanının her alışverişinde, her bankacılık işleminde, her telefon edişinde, her internet sayfasını ziyaret edişinde, her elektronik işlemin sonucunda kaydedilen, uzaktan algılayıcılardan, uydulardan, sensorlardan, optik okuyuculardan toplanan, saklanan veriler her an inanılmaz boyutta artmaktadır[2]. Çok farklı alanlardan oldukça artan bir hızda veriler toplanılmakta ve biriktirilmektedir[3]. Birçok kuruluş bir hafta içinde bir insanın ömrü boyunca okuyabileceğinden daha fazla veri, enformasyon üretmektedir[4].

Teknolojinin; işletmelerin, organizasyonların, üniversitelerin, üretim merkezlerinin, araştırma kuruluşlarının, haberleşme kanallarının faaliyetleri sonucu ortaya çıkan verileri kaydedebilmesi, çeşitli şekillerde saklayabilmesi bu artışın temel nedenidir.

Ortaya çıkan miktarı oldukça hızlı bir şekilde artan bu çok büyük hacimdeki veriler veritabanlarında, veri ambarlarında saklanılmaktadır[5].

Çağımızda organizasyonlar faaliyet alanlarında meydana gelen değişimlere oldukça hızlı cevap verebilmek bakımından oldukça büyük baskı altındadırlar. Bu sebeble, karar vermek için ihtiyaç duyulan enformasyon kaynaklarına en hızlı şekilde erişmek gerektiği açıktır[6]. Geleceğe yönelik doğru kararların verilebilmesi için geçmiş veriler üzerinde araştırma yapabilmek ve bunlardan ihtiyaç duyulan bilgileri çıkartabilmek zorunluluk haline gelmiştir.

Veritabanlarında, veri ambarlarında depolanan verilerde saklı bulunan yararlı bilgiyi keşfedebilmek amacıyla insanlara yardımcı olacak yeni nesil hesaplama tekniklerine ve araçlarına ihtiyaç duyulmaktadır. Bu teknikler ve araçlar, veriyi anlamlı hale getirmek amacıyla yapılan değişik faaliyetlerin bütünü olarak tanımlanabilen Veritabanlarında Bilgi Keşfi (VBK)’nin konusudur[7]. Bilgi keşfi faaliyeti başarılı olduğu takdirde, keşfedilen yeni bilgi organizasyonun karar verme sürecini iyileştirmede kullanılabilmektedir[8].

Bazı kaynaklarda Veri Madenciliği (VM) ve VTBK aynı süreci ifade eden terimler olarak birbirinin yerine kullanıldığı görülmektedir[9]. VTBK ile VM birbirinin yerine kullanılmasına rağmen ayırt edilmesi gerektiği ifade edilmektedir. VBK süreci, veriden yararlı bilgiyi keşfetmedeki tüm faaliyetleri ifade ederken, VM bu süreçteki özel bir adımı ifade etmektedir[10].

VTBK sadece veri madenciliğini içeren bir süreç değildir. Aşağıdaki şekilde görüldüğü gibi 5 aşamadan oluşmaktadır. VM bu sürecin içerisinde yer alan almaktadır.

 

 

 


[1]John Seely Brown, Paul Duguid, Enformasyonun Sosyal Yaşamı, Çev. İbrahim Bingöl, İstanbul, Türk Henkel Dergisi Yayınları, 2001, s.19-23.

[2] Haldun Akpınar, “Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği,” İstanbul Üniversitesi İşletme Fakültesi Dergisi, C: 29, No: 1, Nisan 2000, s. 2.

[3] Usama Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, “Knowledge Discovery and Data Mining: Towards a Unifying Framework,” Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96), Portland, Oregon, Ağustos 2-4 , 1996, AAAI Press, (Çevrimiçi) http://www.aig.jpl.nasa.gov/kdd96 04 Haziran 2004.

[4] A.e., s. 2.

[5] Alex A. Freitas, Data Mining and Knowledge Discovery with Evolutionary Algorithms, Germany, Springer-Verlag, 2002, s. 1.

[6] Pieter Adriaans, Dolf Zantinge, Data Mining, 2. bs., England, Addison-Wesley, 1997, s. 25.

[7] Fayyad, Shapiro, Smyth, a.g.e., s. 1.

[8] Freitas, a.g.e., s. 1.

[9] Karin Becker, Cinara Ghedini, “A Documentation Infrastructure for the Management of Data Mining Projects,” ,” Information and Software Technology, No: 47, 2005, s. 95.

[10] Fayyad, Shapiro, Smyth, a.g.e., s. 1.