Modul Data Warehouse dan Data Mining
Download Modul Data Warehouse dan Data Mining Bab 07 - Ekstrak Transformasi & Loading
Bab 07 - Ekstrak Transformasi & Loading
Abstract
"Menjelaskan konsep Ekstrak Transformasi dan Loading dengan menggunakan Tools SQL"
Kompetensi
"Mahasiswa mampu menggunakan konsep ETL dalam Data Warehouse dalam SQL Sintaksis"
21. Teknik ETL menggunakan SQL Server 2005
Sebagai contoh proses ETL menggunakan Aplikasi Vendor, akan kita gunakan Microsoft
SQL Server 2005 untuk proses ETL dari beberapa sumber data yang berbeda seperti Flat
File, Excel dan RDBMS menjadi Data Warehouse. Yang harus dipersiapkan antara lain :
i. Data dari Database
ii. Data Teks File (Flat)
iii. Data Excel
1. Buka SQL Server Business Intelligence Development Studio
2. Buat Sebuah project baru Integration Service Project dengan nama “Contoh ETL”
3. Klik Ok
4. Selanjutnya lanjutkan dengan tahapan Load data dari Database
a. Drag Data Flow Task dari toolbox, ganti namanya dengan “import data registrasi”
b. Klik 2x pada Data Flow Task, sehingga menu Data Flow tampil
c. Drag Ole Db Source dari ToolBox, kemudian klik 2x
d. Buat koneksi baru dengan memilih button “new”
e. Pada menu configure “Ole Db Connection Manager” pilih New
f. Pada Form Connection Manager yang tampil tentuka provide koneksi menggunakan
“Microsoft Ole DB provider for SQL Server
g. Tulis nama Server pada server Name
h. Dan Tentukan database yang akan dikoneksikan, contoh dalam kasus ini database SIA
i. Lakukan Test Connection
j. Klik OK 2x
k. Tentukan tabel yang akan diproses, misalnya tabel registrasi
l. Pilih tab column dibawah Connection Manager, kemudian klik OK
m. Ganti nama OleDb Data Source dengan “registrasi source data”
n. Tambahkan komponen ole DB Destination
o. Ganti namanya dengan “registrasi data”
p. Gerakkan panah hijau dari “registrasi source data” ke registrasi data”
q. Klik 2x pada “registrasi data” yang sudah diubah namanya
r. Klik button “new”
s. Pada configure ole DB Connection Manager klik New
t. Tentukan server target dan databasenya, misalkan dalam modul ini yang menjadi target
adalah server dengan nama BAGIR-PC\SQLEXPRES, database KostanWeb seperti
gambar
u. Klik Ok 2x
v. Klik New pada Button New
w. Klik OK, lalu pilih tab Mapping, Klik OK
x. Kembali ke Tab Control Flow, Drag Execute SQL Task ke Grid, ganti nama dengan
“Truncate registrasi_data table”, klik 2x,
y. Klik OK, dan klik Button “Parse Query”
z. Klik OK, dan simpan pekerjaan
22. Load Data dari File Teks
a. Drag For Each Container dari toolbox, dan ganti namanya dengan “loop propinsi”
b. Tambahkan Data Flow Task ke dalam loop tersebut
c. Ganti properti Name dengan “Import Loop
d. Klik Data Flow tersebut 2x sehingga masuk ke Data Flow
e. Drag Flat File Source dan Ole Db Destination dari ToolBox
f. Klik 2x pada Flat File Source
g. Pada form yang tampil, klik new, beri nama Connection dan browse file yang
ditentukan.h. Beri tanda check pada colum names in the first data row, kemudian pilih tab columns.
Klik OB, pilih tab Columns dan klik OK lagi
i. Klik 2x pada Ole DB Destination
j. Klik New untuk membuat tabel baru, ganti kueri
k. Klik OK, pilih Tab Mapping, lihat hasilnya, Klik OK
l. Ubah nama Flat File Source dan Ole DB Destination masing-masing dengan
“Propinsi Source Data” dan “Propinsi Data”
m. Kembali ke tab Control Flow,
n. Tambah Execute SQL Task, ganti namanya dengan “Truncate Propinsi Table”
o. Klik 2x dan tentukan koneksinya, tuliskan kuerinya
p. Klik OK
q. Klik Button “Parse Query” dan OK
r. Klik Loop Propinsi 2x
s. Pilih Tab Collection, tentukan folder Enumerator Configuration dan ekstension file
*.txt, kemudian pilih tab Variable Maping
t. Pilih New Variable
u. Klik OK 2x
v. Kemudian Klik Propinsi Source data pada bagian paling bawah
w. Masuk ke properties, pilih expression, tentukan properties dengan
“ConnectionString” dan Expression dengan “propinsi_var”
x. Klik OK dan Save Pekerjaan dengan memilih Save All
23. Load Data dari File Excel
a. Drag Data Flows Task dari Toolbox ke Halaman Desain Control Flow
b. Ganti namanya dengan “import data siswa”, klik 2x
c. Pada halaman Data Flow Desain yang tampil, drag Excel Data Source dan Ole Db
Destination
d. Klik 2x Excel Data Source sehingga tampil Form Excel Source Editor,
e. Klik New, dan browse sumber Data Excel, lalu klik OK
f. Tentukan Name Of Excel Sheet.
g. Pilih Tab Column
h. Klik OK.
i. Klik 2x pada siswa data,
j. Klik New
k. Klik OK, 2x
l. Dari hasil tampak bahwa kolom tidak bisa dikonversikan langsung, maka disini
dibutuhkan transformasi
m. Hapus link antara kedua objek diatas, dan Drag Data Conversion dari ToolBox, Klik
2x pada Data Conversion setelah memberikan link ke Data Conversion dari data
source
o. Lanjutkan dengan OK dan Klik 2x pada Destination Siswa Data
Lakukan perubahan
p. Klik OK dan kembali ke Control Flow
q. Drag Execute SQL Task dari ToolBox, ganti nama dengan Truncate Siswa Table, klik
2x, lalu lakukan modifikasi
r. Klik OK, lakukan Parse Query dan Klik OK
s. Hubungan Execute SQL dengan Data Flow Task
t. Simpan Pekerjaan
u. Dan Uji coba dengan RUN.
Sumber :
Modul Perkuliahan - Data Warehouse dan Data Mining - Program Studi Sistem Informasi - Fakultas Ilmu Komputer - Universitas Mercu Buana