Ya lanjutan artikel sebelumnya mengenai pengertian secara umum tentang Business Intelligence, kali ini ada pejelasan lebih rinci mengenai Terminologi Data Ware House, Data Mart, Data Mining, OLAP (Online Analytical Processing), MOLAP, ROLAP. (Kelebihan,Kekurangan, dan Deskripsi)
Langsung aja...
A. Data Warehouse
Pengertian Data Warehouse dapat bermacam-macam namun
mempunyai inti yang sama, seperti pendapat beberapa ahli berikut ini :
Menurut W.H. Inmon dan Richard D.H., data warehouse
adalah koleksi data yang mempunyai sifat berorientasi
subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam
mendukung proses pengambilan keputusan management.
Menurut Vidette Poe, data warehouse merupakan
database yang bersifat analisis dan read only yang digunakan sebagai fondasi
dari sistem penunjang keputusan.
Jadi, Data Warehouse merupakan motode dalam perancangan database yang
menunjang DSS (Decission Support System) dan EIS (Executive Information
System). Data warehouse adalah database
yang berisi data dari beberapa system operasional yang terintegrasi dan
terstruktur sehingga dapat digunakan untuk mendukung analisa dan proses
pengambilan keputusan dalam bisnis. Data warehouse didesain untuk dapat
melakukan query dengan cepat. Informasi diturunkan dari data lain, dilakukan
rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk
mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat
trend (kecenderungan).
Istilah-istilah
yang berkaitan dengan data warehouse :
1. Data Mart
2. On-Line Analytical Processing(OLAP)
3. Data Maining
Keuntungan
Data Warehouse
Data warehouse merupakan pendekatan untuk menyimpan
data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada
beberapa database (OLTP) dimigrasikan untuk penyimpanan data yang homogen dan
terpisah. Keuntungan dengan menggunakan data warehouse adalah :
1. Data
diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan
transaksi.
2. Perbedaan
diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat
diatasi.
3. Aturan
untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data
apabila data dipindahkan dari database OLTP ke data warehouse.
4. Masalah
keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Karakteristik Data Warehouse
1. Subject Oriented (Berorientasi subject)
Data warehouse berorientasi
subject artinya data warehouse didesain untuk menganalisa data berdasarkan
subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi
aplikasi tertentu.
2. Integrated
(Terintegrasi)
Data Warehouse dapat
menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu
format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan
demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu
kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri.
Syarat integrasi sumber
data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan
variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean
dan konsisten dalam atribut fisik dari data.
3. Time-variant
(Rentang Waktu)
Seluruh data pada data
warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk
melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data
warehouse, kita dapat menggunakan cara antara lain :
Cara
pertama, yang paling sederhana adalah menyajikan data
warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke
depan.
Cara
yang kedua, dengan menggunakan variasi/perbedaan waktu yang
disajikan dalam data warehouse baik implicit maupun explicit secara explicit
dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada
saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan.
Unsur waktu akan tetap ada secara implisit didalam data tersebut.
Cara
yang ketiga, variasi waktu yang disajikan data
warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan
tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan
data yang ada bersifat read-only.
4. Non-Volatile
data pada data
warehouse tidak di-update secara real time tetapi di refresh dari sistem
operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database
itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara
kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan
data sebelumnya.
Berbeda dengan database
operasional yang dapat melakukan update,insert dan delete terhadap data yang
mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan
memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses
data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan,
tidak ada kegiatan updating data).
Langkah Data Warehouse
B. Data Mart
Pengertian
Data Mart
Data Mart adalah
bagian pada data warehouse yang mendukung pembuatan laporan dan analisa
data pada suatu unit, bagian atau operasional pada suatu persahaan. Data mart sering digunakan untuk memberikan informasi
kepada segmen fungsional organisasi.
Karakteristik
Data Mart
·
Data mart memfokuskan hanya pada
kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi
bisnis.
·
Data mart biasanya tidak mengandung data
operasional yang rinci seperti pada data warehouse.
·
Data mart hanya mengandung sedikit
informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami.
Perbedaan
Data Mart dan Data Warehouse
Keutungan
dan Kerugian Data Mart
·
Keuntungan
Data mart dapat meningkatkan waktu
respon pengguna akhir, karena berisi data mentah yang memungkinkan sistem
komputer untuk fokus pada satu tugas, sehingga meningkatkan kinerja. Berbeda
dengan sistem OLTP, data mart juga dapat menyimpan data historis yang
memungkinkan pengguna untuk menganalisis kecenderungan data. Selain itu, data
mart tidak begitu mahal dan kompleks sebagai data gudang untuk setup dan
melaksanakan karena masalah teknis tidak begitu sulit untuk diselesaikan.
·
Kerugian
Mmemiliki nilai yang terbatas karena mereka tidak dapat
melihat organisasi secara keseluruhan dan pelaporan dan analisis potensi
terbatas.
C. Pengertian Data Maining
Data Mining merupakan Serangkaian proses untuk
menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara
manual dari suatu basis data atau bisa disebut dengan KDD ( Knowledge Discovery
in Database). Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan
mengenali pola yang penting atau menarik dari data yang terdapat dalam basis
data.
Konsep
Data Mainin
Data Cleaning & Integration
Digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basis data yang mungkin berbeda format maupun platform yang kemudian diintegrasikan dalam satu database data warehouse.
Data Cleaning & Integration
Digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basis data yang mungkin berbeda format maupun platform yang kemudian diintegrasikan dalam satu database data warehouse.
2 Data
selection
Data yang relevan dengan tugas analisis yang dikembalikan ke dalam database
Data Tranformatio
Data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau ringkasan agresi.
Knowledge Discovery
Data yang relevan dengan tugas analisis yang dikembalikan ke dalam database
Data Tranformatio
Data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau ringkasan agresi.
Knowledge Discovery
Proses esensial dimana metedo yang
intelejen dignakan untuk mengekstrak pola data.
Pattern Evolution
Untuk mengidentifikasi pola yang
benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa
tindakan yang menarik.
Knowledge Presentation
Dimana gambaran teknik visualisasi
dan pengetahuan digunakan untuk memberikan pengetahan yang telah ditambah
kepada user.
D. OLAP (Online Analytical Processing)
Pengertian
OLAP
Pemrosesan database yang menggunakan tabel fakta dan
dimensi untuk dapat menampilkan berbagai macam bentuk laporan analisis query
transaksi sehari-hari.
Keuntungan
OLAP
·
Meningkatkan produktifitas pemakai akhir
bisnis, pengembang IT, dan keseluruhan organisasi. Pengawasan yang lebih dan
akses tepat waktu terhadap informasi strategis dapat membuat pengambilan
keputusan lebih efektif.
·
Mengurangi “backlog” pengembangan aplikasi
bagi staf IT dengan membuat pemakai akhir dapat merubah schema dan membangun
model sendiri.
Kekurangan OLTP
·
Seperti halnya sistem pengolahan
informasi, keamanan dan keandalan adalah suatupertimbangan., bila organisasi
memilih untuk mengandalkan OLTP, operasi dapatsangat mempengaruhi jika sistem
transaksi atau database karena tidak tersedia.
·
Data yang rusak, kegagalan sistem, atau
masalah ketersediaan jaringan.
·
Selain itu, seperti banyak solusi modern
teknologi informasi online, beberapa sistemmembutuhkan pemeliharaan offline
yang selanjutnya mempengaruhi pada analisa biayadan manfaat.
E. ROLAP (Relational OLAP)
Pengertian ROLAP
ROLAP
adalah tipe OLAP yang bergantung kepada database relasional atau RDBMS
(Relational Database Management System) sebagai media penyimpanan (storage)
data yang akan diolah. Dengan strategi tersebut maka OLAP Server terhindar dari
masalah pengelolaan data storage dan hanya menerjemahkan proses query analysis
(MDX) ke relational query (SQL). Otomatis
proses optimasi ROLAP akan sangat ditentukan di sisi produk RDBMS yang
digunakan misalkan dari sisi penanganan jumlah data dan strategi indexing.
Cara kerja ROLAP secara umum adalah sebagai berikut :
- OLAP client mengirimkan query analisis ke OLAP Server.
- OLAP server akan melakukan pemeriksaan di cache apakah sudah bisa melayani permintaan query dari client tersebut, jika sudah akan dikirimkan.
- Jika pada cache belum terdapat data diminta, akan dilakukan query SQL ke data mart dan hasil eksekusinya disimpan di cache dan dikirimkan kepada client.
- Demikian seterusnya.
- Cache akan disimpan selama periode waktu tertentu dan akan dibersihkan total jika server dimatikan.
Keuntungan
dari ROLAP ini adalah tidak memerlukan storage tambahan. Namun kelemahannya adalah jika data untuk suatu cube sangat besar
(masif) maka performa pengambilan data akan cukup buruk.
F. HOLAP (Hybrid OLAP)
HOLAP
untuk mengatasi kelemahan dari ROLAP dan MOLAP, kelemahan tersebut adalah :
Performa ROLAP tidak begitu baik karena agregasi selalu dilakukan ulang apabila cache sudah expired.
Keterbatasan storage dari MOLAP jika digunakan untuk menyimpan kombinasi agregasi pada semua level.
Performa ROLAP tidak begitu baik karena agregasi selalu dilakukan ulang apabila cache sudah expired.
Keterbatasan storage dari MOLAP jika digunakan untuk menyimpan kombinasi agregasi pada semua level.
Jadi
HOLAP merupakan kombinasi atau "jalan tengah" antara keduanya dimana
HOLAP akan menyimpan data precomputed aggregate pada media penyimpanan
(storage) HOLAP sendiri.
Yang
disimpan pada storage HOLAP adalah data untuk beberapa level teratas atau high
level view. Sedangkan untuk level yang lebih rendah atau lebih rinci akan
disimpan di database relasional. Ilustrasi dari penjelasan tersebut bisa
dilihat pada gambar di bawah ini (klik untuk memperbesar).
Referensi :
http://ullyamalinda.wordpress.com/2013/01/24/business-intelligence-kapita-selekta-22-januari-2013/
infonya cukup menarik kaka :D
BalasHapusTerimakasih mbaaa :D
Hapus