
Veri Ambarına Giriş?
Kasım 2011 de Gartner Sempozyumu 21. yüzyılın petrolü bilgi olacaktır sözü ile açılmış.
Artık veri çağındayız ve heryerden bilgi fışkırıyor diyebiliriz.Hemde öyle azımsanacak kadar da değil trilyonlarca satır veriden bahsediliyor.Bu verinin bu kadar devasa bir şekilde artmasının nedenlerinden biri FOMO hastalığı Evet yanlış duymadınız bu bir hastalık.sürekli her yaptığını paylaşma hissi ,online olmadığı zamanlarda huzursuz olmak gibi başlıca belirtileri varmış:)
Bunun dışında iş hayatının internet tabanlı olması ve telekomünikasyon kurumu ile aklımıza gelebilecek hertürlü bilginin elektromanyetik sistemlerle iletilmesi ile artan hemde hiç durmadan artan veri meydana geliyor.Eee hal böyle olunca bu tüketici insan grubunun nerede gezdiği ,neleri satın aldığı, ne okuduğu gibi bilgilerde bu veriye eklenip daha büyük ,çok büyük veri haline geliyor.Hatta ilerde bu elde edilen verilerin analizi sonucunda tüketiciye danışmadan ürün sipariş edilebileceği ve “buyurun efendim buna ihtiyacınız varmış” gibi olaylar yaşanacağı konuşmalar arasında geçiyor.
Şimdi gelelim asıl konumuz olan veri ambarına.Peki nedir bu veri ambarları?
Aslında hiç saptırmadan var olan verinin ambarı diyebilir miyiz?Veri ambarı ile veritabanı sistemleri arasında nasıl bir ilişki kurulabilir.Yani bir veri ambarının veri tabanından farkı nedir.
Günlük kullandığımız veri tabanları birbiri ile ilişkili verilerden ve tablolardan oluşur.Bu verilerin birbiri ile olan ilişkileri tablolar üzerinde tanımlıdır.
Bir e-ticaret sitesinin veri tabanını düşünelim. Böyle bir sistemde anlık olaylar söz konusudur.Sipariş edilen ürünler,yeni üye kaydı,ürün kaydı vs gibi olaylar anlık eklenir.Yada güncellenmesi gereken bir ürünün özellikleri dinamik bir biçimde halledilir.Buda sistemin canlı olduğunu gösterir.Hal böyleyken bu denli canlı bir sistem üzerinde analiz yapmak performansı olumsuz etkiler.
Veri ambarları ise OLTP veri tabanlarından farklı olarak , çeşitli kaynaklardan gelen birbiri ile ilişkili yapılardır.Veri ambarlarına veriler gelmeden önce ETL işlemleri ile veri temizliği,güvenliği ve tutarlılığı gibi işlemlerden geçer.Günlük kullanılanılan bir ilişkisel veri tabanı üzerinden analiz yapılamaz.Çünkü çok güncel verileri tutar.Birde Veri ambarı ile ilgili olan OLAP sistemleri vardır.Olaplar veri ambarlarının üzerine kurulu olup veri analizinin sağlanabildiği yapılardır.Burada OLTP sistemlerindeki kadar güncel veriler tutulmaz.Canlı ve dinamik bir akış görülmez.
Aşağıdaki görseli konu hakkında tarama yaparken buradan edindim.Bence veri ambarlarının farklı kaynaklardan veri alma mantığını esprili bir dil ile anlatıyor.Benim bu yazıda anlatacaklarım bukadar.Bir sonraki yazıda Veri Ambarı Tasarımı ile ilgili olacaktır.Keyifli okumalar.
Leave a reply