Pertemuan Kedua Data Warehouse - Arsitektur Dasar Data Warehouse

Arsitektur Dasar Data Warehouse

Nama : Anak Agung Bagus Wiryadika
NIM : 1805551059
Matakuliah : Data Warehouse (A)
Dosen : I Putu Agus Eka Pratama ST.,MT.
Jurusan/Fakultas/Universitas : Teknologi Informasi/Teknik/Udayana

Terdapat dua buah teori dalam hal data warehouse dari founder teknologi data warehouse, yaitu

Bill inmon: Data Warehouse meiliki 6 sifat utama, yaitu Subject oriented, integrated, process oriented, time variant, accessible, dan non volatile

Ralph Kimball: Data warehouse mengummpulkan data dari sumber - sumber transaksional (OLTP) untuk kebutuhan query dan analisa data (OLAP)

Kedua teori tersebut saling melengkapi dalam menyempurnakan teknologi data warehouse. Data warehouse sendiri berfokus pada OLAP yang berbeda dari database yang menggunakan OLTP.

OLTP dan OLAP

Berikut adalah perbedaan OLTP dan OLAP,

OLTP: Online data processing, data - data transaksional
OLAP: Online Analytical processing, query dan analisa, memperhatikan historis data

Arsitektur Dasar Data Warehouse


Berdasarkan gambar tersebut, pada dasarnya arsitektur dasar data warehouse terdiri dari:
  1. Data source (Sumber data), yang dimana dapat berasal dari data transaksional sistem, file, berkas, dokumen yang sudah di digitalkan, flat file, dan lain sebagainya yang dimana kemudian di simpan pada summary data.
  2. Warehouse (Gudang dari data), yang dimana pada warehouse tersebut akan memuat metadata, summary data, dan raw data, selain itu pada warehouse ini akan terdapat juga pengubahan dari 'transaksional' menjadi 'analitikal' (melalui OLTP ke OLAP)
  3. User (Pengguna), yaitu dimana terbagi menjadi tiga (Analyst, mining, dan reporting), Analyst sendiri bertugas dalam menganalisa data, mining bertugas memperoleh pengetahuan (knowledge) dari data sesuai dengan pola, dan reporting yang bertugas menyampaikan laporan berdasarkan hasil analisa dan mining.

Arsitektur Staging Area dan Data Mart

Konsep dasarnya adalah penambahan staging area untuk menampang data - data dari sumber data transaksional sebelum diteruskan ke warehouse.. Kemudian data tersebut akan dirapikan, dibersihkan dan disesuaikan dengan kebutuhan.

Sumber Data Pada Warehouse

Sumber data pada pada Data warehouse dibedakan menjadi 2, yaitu
  1. Sumber data internal, berasal dari data - data sistem transaksional, file scan, dokumen office, file teks, flat file, dan lain sebagainya di jaringan internal (Intranet) perusahaan.
  2. SUmber file eksternal, berasal dari komputer atau server yang terhubung melalui jaringan publik (Internet) untuk kemudian di gudangkan ke dalam sistem Data Warehouse di jaringan lokal (intranet) perusahaan.

Referensi

I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika.
Bandung. 2017

Comments