Modul Data Warehouse dan Data Mining
Download Modul Data Warehouse dan Data Mining Bab 03 - Data Warehouse & ERP
Bab 03 - Data Warehouse & ERP
Abstract
"Menjelaskan perbedaan yang mendasar antara Data Warehouse dan ERP"
Kompetensi
"Mahasiswa mampu membedakan antara Data Warehouse dan ERP"
3. Perkembangan Data Warehousing
Data Warehousing telah menjadi mainstream. Banyak perusahaan yang memiliki
komitmen dalam pembuatan Data Warehouse. Sekitar 90% perusahaan multinasional
memiliki Data Warehouse atau juga merencanakan pembuatan Data Warehouse dalam
perusahaannya.
Pada hampir semua industri di berbagai bidang, mulai dari ritel, toko hingga lembaga
keuangan, dari perusahaan manufaktur hingga departemen pemerintah, mulai perusahaan
penerbangan hingga bisnis, Data Warehouse telah merevolusi cara seseorang melakukan
analisis bisnisnya dan membuat keputusan strategis. Setiap perusahaan yang memiliki
sebuah Data Warehouse, pada dasarnya sedang merealisasikan keuntungan yang sangat
besar. Banyak perusahaan-perusahaan ini yang saat ini menggunakan teknologi berbasis
web, sedang meningkatkan potensinya dalam menyampaikan informasi vital yang lebih
mudah dan lebih besar.
a. Data Warehousing telah menjadi mainstream
Pada wilayah ini, ada empat faktor signifikan yang telah membawa banyak
perusahaan menerapkan Data Warehouse:
i. Kompetisi tinggi
ii. Peraturan pemerintah
iii. Kebutuhan untuk merubah proses internal
iv. Sangat penting untuk kustomisasi pemasaran
Industri perbankan, telekomunikasi dan ritel adalah industri yang pertama kali
menggunakan Data Warehousing, hal ini terjadi pada bisnis telekomunikasi
dikarenakan tingginya persaingan, gelombang industri berikutnya yang
menerapkan Data Warehousing adalah layanan keuangan, kesehatan, asuransi,
manufaktur, farmasi, transportasi dan distribusi. Di masa kini industri
telekomunikasi dan perbankan banyak berinvestasi dalam Data Warehouse.
Kurang lebih 15% anggaran teknologi dalam industri-industri dikeluarkan untuk
Data Warehouse. Perusahaan dalam industri-industri ini memiliki volume
transaksi data yang sangat besar. Data Warehouse mampu mentransformasi
volume data besar ini menjadi informasi strategis dalam pengambilan keputusan.
b. Ekspansi Data Warehouse
Walaupun pada awalnya Data Warehouse dikonsentrasikan dalam menjaga
ringkasan data untuk analisis level tinggi, namun saat ini dapat dilihat bahwa Data
Warehouse yang lebih besar dibangun oleh banyak bisnis yang berbeda-beda.
Saat ini perusahaan-perusahaan memiliki kemampuan untuk menangkap,
membersihkan, memelihara dan menggunakan sejumlah besar data yang
dihasilkan transaksi bisnis mereka.
c. Produk dan solusi vendor
Sebagai seorang profesional di bidang Teknologi Informasi, maka anda akrab
dengan vendor database dan produk database. Pada saat yang sama, anda juga
akan akrab dengan kebanyakan sistem operasi dan vendornya. Ada ratusan vendor
Data Warehousing dan ribuan produk maupun solusi Data Warehousing.
Saat ini perusahaan database tradisional juga memasuki pasar Data Warehousing.
Mereka mulai menawarkan solusi Data Warehousing bersama dengan produk
database mereka. Di sisi lain, tooltransformasi dan ekstraksi dipaketkan dengan
Database Management System (DBMS). Di sisi lain lagi, toolpelaporan dan
penelaahan dipertajam dengan Data Warehousing. Beberapa vendor database
melakukan peningkatan lebih jauh dengan menawarkan produk untuk hal-hal
kompleks seperti tool Data Mining.
Pasar Data Warehouse secara garis besar dapat dibagi menjadi dua kelompok
yakni : kelompok pertama terdiri dari vendor Data Warehouse dan pelayanan
produk untuk kebutuhan-kebutuhan Data Warehouse perusahaan dimana semua
data enterprise diintegrasikan dan ditansformasikan. Segmen ini dianggap sebagai
pasar untuk Data Warehouse strategis. Segmen ini menguasai hampir sepertiga
dari total pasar. Segmen kedua lebih longgar dan menebar, terdiri dari data mart
departemen, sistem pemasaran database yang terpisah-pisah, dan wilayah sistem
pengambilan keputusan (DSS). Vendor dan produk spesifik mendominasi masingmasing
segmen.Gambar 3.1 menampilkan daftar produk dikelompokkkan
berdasarkan fungsi yang diperankannya dalam sebuah Data Warehouse.4. Trend Yang terjadi
Beberapa pakar berpendapat bahwa teknologi yang telah menggiring Data Warehouse
hingga saat ini. Para pakar ini juga berpendapat kita telah melihat kemajuan perangkat
lunak yang cukup penting. Data Warehouse telah memicu perubahan besar dalam
perkembangan perangkat lunak seperti optimisasi kueri, pengindekan tabel yang sangat
besar, peningkatan kompresi data dandimensional modeling.Pertanyaan utama yang harus
dipersiapkan jawabannya adalah : Apakah yang harus anda lakukan untuk memperoleh
keuntungan dari trend dalam Data Warehouse anda?
a. Multiple Data Types
Ketika membangun iterasi pertama dari Data Warehouse, mungkin anda memasukkan
data numerik. Namun segera anda akan menyadari bahwa pemasukan data numerik
terstruktur tidaklah cukup. Persiapkan untuk mempertimbangkan tipe data yang lain.
Secara tradisional, struktur data perusahaan kebanyakan numerik di dalam Data
Warehouse mereka. Dari sudut pandang ini maka DSS dapat dibagi menjadi 2 kelompok :
Data Warehousing yang berurusan dengan data terstruktur; knowledge management yang
melibatkan data tidak terstruktur. Contoh : kebanyakan Data marketing terdiri data
terstruktur yang bernilai numerik. Data marketing juga berisikan data tidak terstruktur
dalam bentuk gambar. Diumpamakan seorang pengambil keputusan sedang melakukan
analisis untuk mencari tipe produk yang paling banyak terjual, setelah menemukan
produk tersebut, pengambil keputusan ingin meihat gambar untuk membuat keputusan
lebih jauh, bagaimana hal ini dapat diwujudkan? Perusahaan disini menyadari kebutuhan
untuk mengintegrasikan baik data terstruktur dan tidak terstruktur di dalam Data
Warehouse mereka.
i. Penambahan Data yang tidak terstruktur
Beberapa vendor memasukkan Data yang tidak terstruktur terutama sekali teks
dan gambar dengan memeriksa data multimedia sebagaimana tipe data lainnya,
yang didefinisikan sebagai bagian relasional data dan disimpan sebagai objek
biner (BLOB) hingga ukuran 2GB.
ii. Pencarian Data yang tidak terstruktur
Anda telah menambahkan Data Warehouse dengan menambahkan Data tidak
terstruktur. Lalu apalagi yang harus dilakukan? Tentu saja tanpa kemampuan
untuk mencari data yang tidak terstruktur, integrasi data akan tidak berarti.
Vendor harus memberikan search engine untuk mencari informasi yang
dibutuhkan user dari data yang tidak terstruktur. Kueri terhadap data gambar
adalah contoh mekanisme pencarian gambar.
iii. Data Spasial
Data Spasial akan meningkatkan nilai Data Warehouse anda. Alamat, blok jalan,
kota, kabupaten, kelurahan dan kode pos adalah contoh Data Spasial.
b. Visualisasi Data
Ketika seorang pengguna melakukan kueri dan berharap untuk melihat hasil hanya
dalam bentuk daftar hasil atau spreadsheet, maka Data Warehouse anda sudah
kadaluarsa. Anda harus bisa menampilkan hasil dalam bentuk chart dan grafik.
Visualisasi data hasil memudahkan proses analisis bagi pengguna ketika pengguna
mencari trend dari waktu ke waktu. Visualisasi data membantu pengguna untuk
memahami kueri data dengan cepat dan mudah.Tiga trend utama visualisasi data yang
telah mengarahkan pembentukan perangkat lunak visualisasi data adalah :
1. Tipe Grafik
2. Visualisasi interaktif, Grafik bersifat interaktif dimana pengguna dapat
grafik yang dihasilkan, mengelolanya dan melihat tampilan terbarunya secara
online.
3. Visualisasi Result set yang besar dan komplek. Perangkat lunak dengan
visualisasi terbaru dapat memvisualisasikan ribuan poin hasil data terstruktur yang
kompleks.
Gambar 3.2. menyajikan trend-trend ini. Perhatikan bagaimana teknologi
mendewasakan diri, berevolusi dan tumbuh.
ii. Tipe Visualisasi
Kebutuhan user saat ini beraneka ragam, user bisnis membutuhkan chart pie dan bar,
user teknis dan saintis membutuhkan scatter plot dan constellation graph. Analis
yang memperhatikan data spasial membutuhkan peta dan representasi tiga-dimensi
lainnya. Eksekutif dan manajer yang harus memonitor matrik kinerja, seperti pedoman
dijital yang memungkinkan untuk visualisasi matrik seperti speedometer, termometer
atau lampu lalu lintas.
iii. Advance Visualization Techniques. Kemajuan teknik visualisasi adalah transisi dari
chart statis menjadi penyajian yang interaktif dan dinamis.
1. Chart Manipulation, user dapat memutar chart atau secara dinamis dapat
mengganti tipe chart untuk memperoleh hasil yang lebih diharapkan. Dengan tipe
visualisasi yang komplek user dapat memilih sebuah titik data dengan mouse dan
menggerakkan titik tersebut di sekitar view.
2. Drill Down, pengguna dapat melihat visualisasi data dengan tingkat ketelitian dan
lebih detil.
3. Advance Interaction. Teknik ini meminimumkan user interface yang kurang
berguna. Pengguna dibuat langsung dapat men-double-click salah satubagian dari
visualisasi dan men-drag dan drop representasi entitas data. Atau dibuat lebih
sederhana lagi dimana user melakukan klik kanan dan menentukan pilihan dari sebuah
menu.
c. Parallel Processing
i. Parallel Processing Hardware Options
ii. Parallel Processing Software Implementation
d. ToolKueri
Pada Data Warehouse, seperangkat tool fungsional yang sangat utama adalah
seperangkat tool kueri. Kesuksesan Data Warehouse anda bergantung pada tool kueri.
Banyak vendor Data Warehouse telah meningkatkan kemampuan tool kueri. Fungsifungsi
yang telah dikembangkan oleh vendor-vendor terkait tool kueri antara lain :
i. Flexible Presentation
ii. Aggregate Awareness
iii. Crossing Subject Areas
iv. Multiple Heterogeneous sources
v. Integrasi
vi. Mengatasi Keterbatasan SQL(Overcoming SQL Limitation), menggunakan SQL
Extension
e. Tool Browser
f. Data Fusion
Sebuah Data Warehouse adalah tempat dimana data dari banyak sumber data
diintegrasikan untuk menyediakan tampilan yang menyatu pada skala enterprise. Data
boleh jadi berasal dari berbagai macam sistem operasi yang berbeda platform atau
mungkin di simpan dalam file flat ataupun DBMS. Dalam penyimpanan Data
Warehouse dapat ditemukan juga banyak data yang tidak terstruktur seperti data
berbentuk dokumen, gambar, audio dan video.
Berbagai macam data dari banyak sumber yang terpisah ini harus diintegrasikan atau
difusikan dan disimpan dalam sebuah Data Warehouse. Data Fusion adalah teknologi
yang berhubungan dengan merjer data dari sumber data yang berbeda, yang memiliki
ruang lingkup luas dan memasukkan merjer data real-time dari suatu instrumen
maupun sistem monitoring. Banyak penelitian spesifik yang dilakukan terkait
teknologi Data Fusion. Prinsip dan teknik teknologi Data Fusion memiliki sebuah
aplikasi langsung ke Data Warehouse.
Data Fusion tidak hanya berhubungan dengan merjer data dari beberapa sumber data,
namun juga aplikasi lainnya dalam Data Warehouse. Pada masa kini, dengan teknologi
Data Warehouse, kita dapat mengumpulkan data dalam proporsi astronomis,semakin
banyak informasi yang disimpan, semakin sulit mencari informasi yang benar pada
waktu yang tepat. Teknologi Data Fusion diharapkan yang dapat memecahkan
masalah ini. Data Fusion masih menjadi area penelitian,Vendor belum memproduksi
tools data Fusion¸yang perlu anda lakukan adalah ikuti perkembangan teknologi.
g. Multidimensional Analysis
Saat ini, seluruh lingkungan Data Warehouse menyediakan analisis multidimensional.
Ini menjadi bagian integral dari sistem pengiriman informasi data Warehouse.
Ketentuan analisis multidimensional bagi user secara sederhana berarti bahwa mereka
akan dapat menganalisis ukuran bisnis dengan berbagai macam cara. Analisis
Multidimensional juga bersinonim dengan Online Analytical Processing (OLAP).
h. Agent Technology
Software Agent adalah sebuah program yang mampu menjalankan kegiatan
pemrograman atas nama pengguna. Contoh : internet, Software Agent dapat digunakan
untuk melakukan sort atau filter email berdasarkan aturan-aturan yang didefinisikan
pengguna. Dalam Data Warehouse Software agent dapat digunakan untuk memberikan
alert kepada pengguna mengenai kondisi bisnis yang telah terlebih dahulu
didefinisikan. Beberapa vendor bahkan mengkhusukan pada tool sistem alert. Anda
harus mempertimbangkan program software agent untuk Data Warehouse anda.
Sumber :
Modul Perkuliahan - Data Warehouse dan Data Mining - Program Studi Sistem Informasi - Fakultas Ilmu Komputer - Universitas Mercu Buana