Veri ambarı, kuruluşların bilgi sistemlerinde depolanan verilerin tamamının veya belirli bir kısmının düzenli bir şekilde tutulduğu, merkezi veri depolama alanına verilen addır. Bu verilerden yola çıkarak anlamlı öngörüler elde edebilmek için farklı kaynaklardan ve farklı türlerden verileri toplama ve yönetme işlemleri bu ortamda yürütülür. Veri ambarlarına “Karar Destek Sistemi”, “İş Zekası Çözümü” ya da “Analitik Uygulama” gibi isimler de verilir.

Veri ambarlarının kendilerine özgü birçok karakteristik özelliği bulunmaktadır. Bunlardan bazıları şunlardır:

  • Organize edilmiş veri
  • Veride tutarlılık
  • Zamansal
  • Kalıcı
  • İlişkisel yapı
  • İstemci / Sunucu mimari
  • Web tabanlı destek
  • Farklı kaynaklar ile entegrasyon
  • Gerçek zamanlı çalışma yeteneği

Inmon ve Kimball yaklaşımları

Veri ambarlarının modellenmesinde en yaygın kullanılan iki yaklaşım, boyutsal yaklaşım (Kimball Metodu) ve normalize yaklaşım (Inmon Metodu) dır. Her iki modelin de birbirlierine göre avantajları ve dezavantajları vardır. Bu yüzden modelleme yaklaşımı seçimi, proje ihtiyaçlarına bağlı olarak yapılmalıdır. İki metodu ayıran temel nokta, veri yapılarının veri ambarında nasıl modellendiği, yüklendiği ve depolandığıdır.

Inmon tarafından öngörülen tasarımda önce bütünleşik ve büyük bir veri ambarının oluşturulması gerektiği, data-mart ihtiyacı varsa bu veri ambarındaki verilerden karşılanması gerektiği görüşü ön plandadır. Kimball yönteminde ise, veri ambarı için data-mart’ların tümünün birleşiminden başka bir şey olmadığı görüşü ortaya çıkmaktadır. Inmon yaklaşımına yukarıdan aşağı (top-down) yaklaşım, Kimball’ınkine de aşağıdan yukarı (bottom-up) yaklaşım adı da verilir.

Inmon yaklaşımı (yukarıdan aşağı)

Bill Inmon tarafından yapılam ve genel kabul görmüş olan tanıma göre;

Veri ambarı, özneye dayalı, bütünleşmiş, zaman dilimli ve yöneticinin karar verme işleminde yardımcı olacak biçimde toplanmış olan değişmeyen veriler topluluğudur.

Başlıca bu dört özellik veri ambarlarını, ilişkisel ve hareket veritabanı sistemlerinden ayıran özelliktir. Bu özellikleri de kısaca inceleyelim:

Özneye Dayalı (subject-oriented)

Veri ambarı bir organizasyonun her güne ait işleri ve hareket işleme faaliyetleri üzerinde yoğunlaşmak yerine, karar verecek kimseler için
veriye ait modelleme ve çözümleme üzerinde yoğunlaşır. Özneden yola çıkarak kullanılmayacak veriyi hariç tutar ve verinin basitleştirilmesini sağlar.

Bütünleşik (integrated)

Veri ambarı genellikle birden çok ve farklı türdeki veri kaynağından alınan kayıtları bir araya getirerek oluşturulur. Verinin tutarlılığını garantilemek için veri temizleme ve bütünleştirme (entegrasyon) yöntemleri uygulanır. Bu işlemler ETL araçları kullanılarak yapılır.

Zaman dilimli (time-variant)

Veri ambarı içerisindeki her bir veri, tarihi bir bakış açısıyla
bilgi sağlamak için depolanır (belli bir zaman aralığındaki veri içerisinden çekilen veriler gibi).

Bozulmayan, kalıcı (non-volatile)

Operasyonel veritabanı sistemlerinde veriler üzerinde sıklıkla ekleme, güncelleme ve silme işlemleri yapılır. Veri ambarında ise ETL süreçleri sonrasında temizlenmiş veri aktarıldığından yeni veri mevcut veriye eklenir ancak mevcut veri güncellenmez ve silinmez. Bu sayede geçmişe yönelik veri analizlerinde tutarsızlıkların önüne geçilmiş olur.

Ralph Kimball‘ın tanımı işe şöyledir:

Bir veri ambarı, sorgu ve analiz için özel olarak yapılandırılmış işlem verilerinin bir kopyasıdır.

Kimball yaklaşımı (bottom-up)

Kimball a göre öncelikli olarak iş ihtiyacı belirlenir ve bu iş ihtiyaçlarına göre datamart modellenerek veri ambarı oluşturulur.

Kimball yaklaşımında, Inmon’dan farklı olarak Yıldız Şema (Star Schema) veya Kar Tanesi Şema (Snowflake Schema) modelleri kullanılır.

Her iki yöntemin kısaca karşılaştırılması şu şekilde yapılabilir:

 Normalize Yaklaşım (Inmon)Boyutsal Yaklaşım
(Kimball)
Veri ambarının oluşturulmasıZaman alıcıDaha az zaman alır
Veri ambarının yönetilmesiKolayDaha zor
MaliyetKurulum maliyeti yüksek, geliştirme maliyeti düşükKurulum maliyeti düşük, ancak her bir geliştirme maliyeti kurulum maliyeti ile hemen hemen aynı
ZamanProjenin devreye alma zamanı uzunİlk başlangıç için daha kısa zaman gereksinimi
Uzmanlık ihtiyacıUzman ekip gerekirDaha az uzman ekip yeterlidir
Veri entegrasyonu ihtiyacıGeniş, kurumsal çaptaDaha az

Veri ambarı hakkında temel düzeyde bilgi vermeyi amaçlayan bu yazı dizisinin diğer başlıklarına da göz atabillirsiniz.