8 Adımda Veri Ambarı (Data Warehouse) Tasarımı
Data warehouse, işletmenin genelinde çeşitli birimlerden elde edilen verilerin toplandığı alandır. Çevrimiçi analitik işleme ile çeşitli sistemlerden toplanan veriler üzerinden mantıksal sorgulamalar yapabilir, isabetli tahmin modelleri oluşturabilir ve geleceğe yönelik eğilimleri inceleyerek senaryolar oluşturabilirsiniz.
GTech’in bu yazısında “Etkili bir Data warehouse tasarımı nasıl olmalıdır?” sorusunu cevaplıyoruz. 8 adımda inceleyelim;
1. İşletmenin İhtiyaçlarını Tanımlama ve Gereksinim Toplama
Veri ambarının gücü toplam veri kapasitesi ve bunu işleme kabiliyetinden geldiğinden, özellikle gereksinim toplama aşamasında bütün birimlerin tasarım sürecinde aktif olarak rol alması ve veri tabanına nasıl katkı sağlayacağı ve sağladığı katkının da işletmeye ne kazandıracağı konularında bilinçli olması beklenir. Tasarım aşamasında güvenlik katmanları oluşturulmalı ve olağanüstü arızalarda sistem kurtarma planları da oluşturulmalıdır.
2. Fiziksel Ortamı Hazırlama
Data warehouse’ların geliştirme, test ve üretim olarak üç ana ortamı vardır. Geliştirme ortamı test ve üretim ortamlarından farklı olarak benzersiz bir akış ortamına sahip olduğundan, farklı bir sunucuda olması gerekir. Benzer şekilde test aşaması da farklı bir sunucuda bulunmalıdır çünkü bu aşamada sunucuya aşırı yük bineceğinden üretim ortamında çalışan kullanıcılar için olumsuzluk yaratabilir. Bu üç ana ortamın dışında ek ortamlar oluşturarak devam eden bir süreç olan iş zekâsı gelişimi desteklenmeli ve Data warehouse işletme ihtiyaçlarına göre değiştirilmeli ve geliştirilmelidir.
3. Veri Modelleme
Veri modelleme aşamasında, veri dağılımı ve verilerin hangi ortamlarda kullanılacağı veri modelleme yardımıyla görselleştirilir. Data warehouse oluşturmadan önce veri kümeleri arasındaki ilişki, bu ilişkilerin adlandırılması ve kurallarının belirlenmesi, veri modelleme sürecinde kapsamlı olarak tasarlanabilir. Data warehouse’u çeşitli birimler değişik amaçlarla kullanacağından veri modelleme ile Data warehouse gerekli yapı kurularak diğer birimlerin verileriyle ilişkilendirir.
4. Çıkar, Aktar, Yükle (Extract, Transfer, Load (ETL)) Çözümünü Seçme
ETL mevcut sistemden ve veri tabanından veriyi çekip Data warehouse’a atma sürecine verilen isimdir ve kritik öneme sahiptir. Bu süreçteki işlemlerin hepsinden ETL sorumlu olduğundan kötü bir ETL süreci bütün Data warehouse’unuzun bozulmasına yol açabilir. Bu süreçte en uygun hız, iyi görselleştirilmiş, kolay ve tutarlı veri aktarımı istediğimiz için işletmemizin Data warehouse’una en uyumlu ETL sürecini tercih etmeliyiz.
5. Çevrimiçi Analitik İşleme (OLAP) Küpleri
Data warehouse verilerinizi çeşitli ihtiyaçlarınız için kullanılmak üzere kolayca analiz edilebilir şekilde topladığımız yerdir. Çevrimiçi Analitik İşleme (Online Analytic Processing) Küpleri ise Data warehouse’taki verileri analiz etmeye ve çoğu zaman da raporlamaya yarar. Data warehouse’lar çok sayıda düzensiz veriden oluştuğunda OLAP küpleri bu verileri çok boyutlu olarak düzenlemeye ve daha hızlı ve kolay analiz etmemizi sağlar. Her işletmenin Data warehouse’u kendi ihtiyaçlarına özel olarak oluşturulduğundan OLAP küpleri de Data warehouse’a özel olarak hazırlanmalıdır.
6. Ön Ucu Oluşturma
Data warehouse’ların arka ucu kısmında veri tabanının düzenlenmesi, analiz için hazır hale getirilmesi aşamaları bulunmaktadır. Ön ucu oluşturma aşaması ise kullanıcının önüne işlenen ve analiz edilen verilerin getirilmesi vardır. Ön ucu oluşturulurken ara yüzün basit ve anlaşılır olmasına dikkat edilmelidir. Data warehouse üzerinden çeşitli raporlar elde edilebilir ancak çalışanların neye ihtiyacı olduğu belirlenmeli ve ona göre hareket edilmelidir.
7. Sorguları Optimize Etme
İşletmenin ihtiyaçlarına göre anlık analizler elde edebilmek için Data warehouse sorgulamalarının optimize edilmesi ve hızlı bir şekilde istenilen raporlara ulaşılması gerekir. Optimizasyon sürecinde Data warehouse’tan her veriyi değil sadece analiz için gereken verinin sorgulamaya dahil edilmesi gerekir.
8. Kullanıma Açma
Data warehouse’umuzu kullanıma hazır hale getirdik ancak sistemin verimliliğini kullanıcı belirler. Bu sebeple Data warehouse’un nasıl kullanılacağı ile ilgili çalışanlara eğitim verilmeli, ihtiyaçları olan raporlar için hangi verilere ihtiyaçları olduğu, birimine özel olarak hangi raporları kullanılacağı ile baştan sonra kapsamlı bir eğitim verilmelidir.
GTech, Bankacılık, Perakendecilik, Sigortacılık, Kiralama, Üretim, Enerji, Kamu gibi pek çok sektör için hazır ve referans verilebilir veri ambarı modelleri ile müşterilerine hizmet sunmaktadır. Siz de yeni nesil platformlar üzerinde yapılan iş analitiği ile stratejinizi veriniz belirlesin istiyorsanız, bize ulaşabilirsiniz.