Translate

Jumat, 25 Januari 2013

Business Intelligence Part 2

Ya lanjutan artikel sebelumnya mengenai pengertian secara umum tentang Business Intelligence, kali ini ada pejelasan lebih rinci mengenai Terminologi Data Ware House, Data Mart, Data Mining, OLAP (Online Analytical Processing), MOLAP, ROLAP. (Kelebihan,Kekurangan, dan Deskripsi)
Langsung aja...

A.  Data Warehouse

Pengertian Data Warehouse dapat bermacam-macam namun mempunyai inti yang sama, seperti pendapat beberapa ahli berikut ini :

Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.

Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.

Jadi, Data Warehouse merupakan  motode dalam perancangan database yang menunjang DSS (Decission Support System) dan EIS (Executive Information System).  Data warehouse adalah database yang berisi data dari beberapa system operasional yang terintegrasi dan terstruktur sehingga dapat digunakan untuk mendukung analisa dan proses pengambilan keputusan dalam bisnis. Data warehouse didesain untuk dapat melakukan query dengan cepat. Informasi diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat trend (kecenderungan).

Istilah-istilah yang berkaitan dengan data warehouse :
1. Data Mart
2. On-Line Analytical Processing(OLAP)
3. Data Maining

Keuntungan Data Warehouse
Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database (OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan dengan menggunakan data warehouse adalah :
1.      Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
2.      Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
3.      Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
4.      Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.


Karakteristik Data Warehouse

1.    Subject Oriented (Berorientasi subject)
Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu.
2.    Integrated (Terintegrasi)
Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri.
Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.
3.    Time-variant (Rentang Waktu)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :
Cara pertama, yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
Cara yang ketiga, variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
4.    Non-Volatile
data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu  ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.

Berbeda dengan database operasional yang dapat melakukan update,insert dan delete terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
 
 Langkah Data Warehouse

B. Data Mart

Pengertian Data Mart
Data Mart adalah  bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasional pada suatu persahaan. Data mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi.

Karakteristik Data Mart
·         Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
·         Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse.
·         Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami.

Perbedaan Data Mart dan Data Warehouse

Keutungan dan Kerugian Data Mart
·         Keuntungan
Data mart dapat meningkatkan waktu respon pengguna akhir, karena berisi data mentah yang memungkinkan sistem komputer untuk fokus pada satu tugas, sehingga meningkatkan kinerja. Berbeda dengan sistem OLTP, data mart juga dapat menyimpan data historis yang memungkinkan pengguna untuk menganalisis kecenderungan data. Selain itu, data mart tidak begitu mahal dan kompleks sebagai data gudang untuk setup dan melaksanakan karena masalah teknis tidak begitu sulit untuk diselesaikan.
·         Kerugian
Mmemiliki nilai yang terbatas karena mereka tidak dapat melihat organisasi secara keseluruhan dan pelaporan dan analisis potensi terbatas.

C. Pengertian Data Maining

Data Mining merupakan Serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data atau bisa disebut dengan KDD ( Knowledge Discovery in Database). Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basis data.

Konsep Data Mainin
Data Cleaning & Integration
Digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basis data yang mungkin berbeda format maupun platform yang kemudian diintegrasikan dalam satu database data warehouse.
2    Data selection
      Data yang relevan dengan tugas analisis yang dikembalikan ke dalam database

      Data Tranformatio
    Data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau ringkasan agresi. 

            Knowledge Discovery
Proses esensial dimana metedo yang intelejen dignakan untuk mengekstrak pola data.

Pattern Evolution
Untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik.

Knowledge Presentation
Dimana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahan yang telah ditambah kepada user.

D. OLAP (Online Analytical Processing)

Pengertian OLAP
Pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan analisis query transaksi sehari-hari.
Keuntungan OLAP
·         Meningkatkan produktifitas pemakai akhir bisnis, pengembang IT, dan keseluruhan organisasi. Pengawasan yang lebih dan akses tepat waktu terhadap informasi strategis dapat membuat pengambilan keputusan lebih efektif.
·         Mengurangi “backlog” pengembangan aplikasi bagi staf IT dengan membuat pemakai akhir dapat merubah schema dan membangun model sendiri.

Kekurangan OLTP

·         Seperti halnya sistem pengolahan informasi, keamanan dan keandalan adalah suatupertimbangan., bila organisasi memilih untuk mengandalkan OLTP, operasi dapatsangat mempengaruhi jika sistem transaksi atau database karena tidak tersedia.
·          Data yang rusak, kegagalan sistem, atau masalah ketersediaan jaringan.
·         Selain itu, seperti banyak solusi modern teknologi informasi online, beberapa sistemmembutuhkan pemeliharaan offline yang selanjutnya mempengaruhi pada analisa biayadan manfaat.

   
E. ROLAP (Relational OLAP)

Pengertian ROLAP
ROLAP adalah tipe OLAP yang bergantung kepada database relasional atau RDBMS (Relational Database Management System) sebagai media penyimpanan (storage) data yang akan diolah. Dengan strategi tersebut maka OLAP Server terhindar dari masalah pengelolaan data storage dan hanya menerjemahkan proses query analysis (MDX) ke relational query (SQL).  Otomatis proses optimasi ROLAP akan sangat ditentukan di sisi produk RDBMS yang digunakan misalkan dari sisi penanganan jumlah data dan strategi indexing.





Cara kerja ROLAP secara umum adalah sebagai berikut :
  • OLAP client mengirimkan query analisis ke OLAP Server.
  • OLAP server akan melakukan pemeriksaan di cache apakah sudah bisa melayani permintaan query dari client tersebut, jika sudah akan dikirimkan.
  • Jika pada cache belum terdapat data diminta, akan dilakukan query SQL ke data mart dan hasil eksekusinya disimpan di cache dan dikirimkan kepada client.
  • Demikian seterusnya.
  • Cache akan disimpan selama periode waktu tertentu dan akan dibersihkan total jika server dimatikan.
Keuntungan dari ROLAP ini adalah tidak memerlukan storage tambahan. Namun kelemahannya adalah  jika data untuk suatu cube sangat besar (masif) maka performa pengambilan data akan cukup buruk.

F. HOLAP (Hybrid OLAP)

HOLAP untuk mengatasi kelemahan dari ROLAP dan MOLAP, kelemahan tersebut adalah :
Performa ROLAP tidak begitu baik karena agregasi selalu dilakukan ulang apabila cache sudah expired.

Keterbatasan storage dari MOLAP jika digunakan untuk menyimpan kombinasi agregasi pada semua level.
Jadi HOLAP merupakan kombinasi atau "jalan tengah" antara keduanya dimana HOLAP akan menyimpan data precomputed aggregate pada media penyimpanan (storage) HOLAP sendiri.
Yang disimpan pada storage HOLAP adalah data untuk beberapa level teratas atau high level view. Sedangkan untuk level yang lebih rendah atau lebih rinci akan disimpan di database relasional. Ilustrasi dari penjelasan tersebut bisa dilihat pada gambar di bawah ini (klik untuk memperbesar).

2 komentar:

Terimkasih untuk kunjungannya, jangan lupaa komen yaaa

Semoga Bermanfaat " Cayooo"