Jumat, 14 Oktober 2011

Contoh membuat model data warehouse

Sebelum mulai membuat data model untuk data warehouse, sebaiknya spesifikasi kebutuhan informasi dan data yang tersedia (sumber data) sudah harus diketahui.
Untuk contoh dalam tulisan ini, kita sederhanakan spesifikasi kebutuhan informasi dan sumber data yaitu hanya spesifikasi kebutuhan fungsional. Tentu saja dalam kenyataan sesungguhnya akan lebih lengkap dan detil. Kita tidak membahas informasi teknis, misalnya spesifikasi kecepatan respons dan penggunaan teknologi internet (web access). Juga tentang sumber data, kita tidak membahas spesifikasi teknis, misalnya format dan ukuran data (field type & length), volume, dan kualitasnya.
Spesifikasi kebutuhan fungsional informasi secara teknis menyatakan data apa yang harus disimpan didalam data warehouse untuk memenuhi analisa yang akan dilakukan oleh pemakai. Ini dapat dinyatakan dalam bentuk pertanyaan yang harus dapat dijawab oleh data didalam data warehouse, misalnya untuk contoh kita sebagai berikut:
Berapa besar penjualan dan laba per bulan, per produk, per tipe pelanggan/pembeli (grosir, pabrikan, industri rumah, atau exportir), jenis industri (dari pelanggan/pembeli), dan kemana barang pesanan dikirim (propinsi atau nama negera)
Pertanyaan pemakai semacam diatas biasa disebut analisa multi-dimensi (multidimensional analysis). Besaran (measure) yang ditanyakan (dianalisa) adalah ‘penjualan’ dan ‘laba’. Batasan (dimension) dari besaran tersebut adalah bulan (period), produk, tipe pelanggan, jenis industri, dan tujuan pengiriman (location).
Selain harus memenuhi spesifikasi fungsional dari pemakai, data model untuk data warehouse yang kita buat (rancang) nantinya harus menampung data dari sumber, yang biasanya adalah data didalam sistem operasional, misalnya dalam contoh kita adalah sistem pesanan (sales order system).
Data model (logical) dari sumber data ini tergambar sebagai berikut. Diagram data model ini dibuat dengan menggunakan Oracle Designer (salah satu modeling software yang populer) Catatan:
Attribute yang bertanda # didepan namanya adalah Primary key.
Foreign key tidak ditunjukkan dalam diagram.
Pemikiran (pada waktu menganalisa dan merancang) dalam pembuatan data model ini adalah:
•Hanya mencakup data yang dibutuhkan, yang lain tidak akan dimasukkan kedalam data warehouse kita (misalnya pajak penjualan, ongkos kirim, cara kirim, alamat pelanggan) untuk menghemat tempat simpan (disk storage space) dan mempercepat query response. Data-data yang tidak dimasukkan ini, bisa ikut diextract dari sumbernya, disimpan ditempat terpisah (seperti misalnya offline storage) untuk memudahkan penambahannya pada saatnya harus ditambahkan kedalam data warehouse kita.
•Tiga dimensi dibuat umum (common dimension), dengan demikian dimensi-dimensi ini dapat dimanfaatkan untuk analisa lain (mendatang)
1. Waktu - untuk memenuhi spesifikasi “per bulan”, yang akan dihubungkan dengan data “tanggal pesan”. Table ini akan diisi semua bulan dan sekian tahun (harus diputuskan berapa tahun, karena tabel ini kecil volumenya, misalnya diisi untuk 50 tahun pada awal implementasi data warehouse)
2. Jenis industri – untuk memenuhi spesifikasi “jenis industri”, yang akan dihubungkan dengan data “industri pelanggan”; diisi lengkap (lihat butir berikut tentang NAICS)
3. Lokasi – untuk memenuhi spesifikasi “propinsi/negara pemakai”, yang akan dihubungkan dengan bagian data “alamat kirim’, dengan kata lain didalam proses memasukkan data dari sumber kedalam warehouse harus mencari dan menentukan propinsi atau negara didalam/dari data alamat kirim.

Tidak ada komentar:

Posting Komentar