Minggu, 27 Januari 2013

Kapita Selekta

Data Ware House


Data Ware House
Data yang terdapat dalam data warehouse dapat dibagi perbagian sesuai dengan kebutuhan dalam informasi. Inilah yang dsebut dengan data mart. Data mart memiliki karakteristik yang sama dengan data warehouse, perbedaannya hanya terdapat pada jumlah data yang dimiliki. Dalam data mart, data yang ada hanya berasal dari satu bagian atau satu departemen saja, sedangkan pada data warehouse, data yang ada berasal dari seluruh bagian dalam perusahaan tersebut.
Dalam pembuatan data warehouse, ada dua pendekatan yang dapat digunakan, yaitu :
Pendekatan Top Down (Top Down Approach)
Pendekatan ini dilakukan dengan membuat perancangan data warehouse terlebih dahulu secara keseluruhan. Dalam pembuatannya, ditentukan apa yang menjadi sumber data dan bagaimana cara untuk memasukkannya ke dalam data warehouse yang telah dirancang terlebih dahulu. Pendekatan ini menyatakan bahwa pembangunan desain arsitektur data warehouse adalah hal pertama yang dilakukan dalam membangun suatu data warehouse.
Pendekatan Bottom Up (Bottom Up Approach)
Berbeda dengan pendekatan Top Down, pendekatan ini menyatakan bahwa data warehouse berawal dari kumpulan data mart yang telah dibangun terlebih dahulu untuk masing-masing departemen. Data mart yang telah dibangun kemudian digabungkan untuk membangun suatu data warehouse yang utuh.
Dalam pembangunan data mart, terdapat 2 arsitektur, yaitu : Dependent Data Mart dan Independent Data Mart (IDM). Perbedaan dari kedua arsitektur tersebut hanya terletak pada ketergantungannya terhadap data warehouse. Pada Dependent Data Mart, data yang diperoleh sangat tergantung pada data warehouse terpusat sedangkan pada IDM, data yang digunakan terpisah dari data warehouse terpusat dan bersifat independent (berdiri sendiri).
Data telah berkembang sangat pesat dalam beberapa dekade terakhir. Banyak bentuk-bentuk yang dulu “hanya“ mempunyai teknologi sebagai tempat penyimpanan data yang terdiri dari field-field, record dan diolah serta ditampilkan menjadi informasi dalam berbagai format tampilan yang sederhana, bermula dari bentuk yang sederhana tersebut maka didapatkan suatu metoda untuk menampilkan suatu database yang berguna untuk menganalisa data untuk suatu keperluan tertentu. Sejak tahun 1980-an , baik organisasi swasta maupun pemerintahan telah bekerja dengan data dalam interval megabyte sampai gigabyte bahkan terabyte. Oleh karena itu, kebutuhan akan alat cangih dan cepat dalam menganalisis data semakin meningkat. Hal ini dikarenakan maju atau mundurnya perusahaan akan sangat bergantung oleh seberapa cepat dan canggihnya sistem informasi yang mereka miliki serta kemampuan mereka dalam menganalisis informasi dengan sistem tersebut. Dengan memanfaatkan relational database yang sudah ada maka didapat suatu cara untuk mengantisipasi kebutuhan guna menganalisa data secara cepat untuk membantu mendapatkan keputusan dalam suatu aplikasi atau organisasi
Sudah sekian lama, perusahaan menganalisis data dengan menggunakan relational DBMS yang sangat sederhana, dan tentunya memiliki keterbatasan dalam melakukan aggregate, summarize, consolidate, sum, view, dan analyze. Kekurangan tersebut akan muncul jika datanya bersifat multidimensi, karena banyak perusahaan menganalisis berbagai data dalam satu waktu yang bersamaan. Oleh karena itu, dibutuhkan suatu multidimensional data analysis sehingga muncullah Online Analytical Processing (OLAP).
SEJARAH
Produk pertama menggunakan  query OLAP adalah Express yang dirilis tahun 1970 ( dan dipakai oleh Oracle tahun 1995 sebagai Information Resources ). Tetapi istilah OLAP baru muncul tahun 1993 diperkenalkan oleh E. F. Codd yang merupakan bapak relational databases. Karangan Codd berisi konsultasi pendek yang Codd lakukan dengan pendiri Arbor Software ( sekarang disebut Hyperion Solutions, dan pada tahun 2007 dibeli oleh Oracle ) untuk memperbaiki pemasaran. Perusahaan tersebut kemudian merilis produk OLAP, Essbase, yang menerapkan 12 aturan Codd untuk online analytical processing. OLAP market tumbuh dengan cepat pada akhir tahun 90an dengan banyak komersial produk yang muncul di pasaran. Pada tahun 1998, Microsoft merilis OLAP server pertamanya, Microsoft Analysis Services yang dikembangkan dengan mengadopsi teknologi OLAP.
DEFINISI
Online Analytical Processing (OLAP ) merupakan suatu metode pendekatan untuk menyajikan jawaban dari  permintaan proses analisis yang bersifat dimensional secara cepat, yaitu desain dari aplikasi dan teknologi yang dapat mengoleksi, menyimpan, memanipulasi suatu data multidimensi untuk tujuan analisis.
OLAP (Online Analytical Processing) adalah teknologi yang memproses data di dalam data warehouse dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query analisis yang kompleks.
TEKNIK OLAP
Selain itu, teknik OLAP itu sendiri dapat dirangkum menjadi 5 garis besar  yaitu Fast Analysis of Shared Multidimensional Information atau disingkat menjadi FASMI yang masing-masing berarti sebagai berikut:
FAST,  berarti sistem ditargetkan untuk memberikan response terhadap user dengan  secepat mungkin, sesuai dengan analisis yang dilakukan.
ANALYSIS,  berarti sistem dapat mengatasi berbagai logika bisnis dan analisis statistik yang relevan dengan aplikasi dan user, dan mudah.
SHARED,  berarti sistem melaksanakan seluruh kebutuhan pengamanan data, jika dibutuhkan banyak akses penulisan terhadap data, disesuaikan dengan level dari user. Tidak semua aplikasi membutuhkan user untuk menulis data kembali. Sistem harus dapat meng-handle multiple update dalam satu waktu secara aman.
MULTIDIMENSIONAL,  berarti sistem harus menghasilkan conceptual view dari data secara multidimensional, meliputi full support untuk hierarki dan mutiple hierarki. Hal ini merupakan cara yang logic untuk menganalisis bisnis dan organisasi.
INFORMATION,  adalah semua data dan informasi yang dibutuhkan dan relevan untuk aplikasi. Kapasitas produk OLAP berbeda untuk menghandle input data tergantung beberapa pertimbangan meliputi duplikasi data, RAM yang dibutuhkan, penggunaan disk space, performance, integrasi dengan data warehouse, dan lainnya.
Karakteristik
Adapun karakteristik dari OLAP, yaitu:
Mengijinkan user melihat data dari sudut pandang logical dan multidimensional pada data warehouse
Memfasilitasi query yang komplek dan analisa bagi user
Mengijinkan user melakukan drill down untuk menampilkan data pada level yang lebih detil atau roll up untuk agregasi dari satu dimensi atau beberapa dimensi
Menyediakan proses kalkulasi dan perbandingan data
Menampilkan hasil dalam bentuk number termasuk dalam tabel dan grafik.
TEMPAT PENYIMPANAN
Dari OLAP tersebut terdapat 3 model penyimpanan data dalam cube yang difasilitasi oleh Microsoft SQL Server 7.0. Ketiga model penyimpanan data tersebut adalah:
MOLAP
Multidimensional online analitycal processing (MOLAP) menyimpan data dan agregasi pada struktur data multidimensi. Struktur MOLAP ini tidak tersimpan pada data warehouse tapi tersimpan pada OLAP server. Sehingga performa query yang dihasilkan olehnya sangat bagus. Model penyimpanan ini sesuai untuk database dengan ukuran kecil sampai sedang.
ROLAP
ROLAP (relational online Analitycal processing) menggunakan tabel pada database relasional data warehouse untuk menyimpan detil data dan agregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan database, ia mengakses langsung pada tabel fact ketika membutuhkan jawaban sebuah query. Sehingga query pada ROLAP mempunyai response time yang lebih lambat dibandingkan ROLAP maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar dan jarang dilakukannya proses query. Misalkan, data histori dalam jumlah besar dari beberapa tahun yang sebelumnya.
HOLAP
Gabungan model MOLAP dan ROLAP dapat kita peroleh dari HOLAP (hibrid online analitycal processing).Detil data tersimpan pada tabel relasional tapi aggregasi data disimpan dalam format multidimensi. Misalkan proses drill down dilakukan pada sebuah tabel fakta, maka retrive data akan dilakukan dari tabel database relasional sehingga query tidak secepat MOLAP. Kubus HOLAP lebih kecil daripada kubus MOLAP tapi response time query masih lebih cepat jika dibandingkan dengan ROLAP. Model penyimpanan HOLAP ini biasanya sesuai untuk kubus yang membutuhkan performa query yang bagus dengan jumlah data yang besar.
Pengguna OLAP umumnya memanfaatkan OLAP dengan pola analisis seperti berikut :
Meringkas dan mengumpulkan sejumlah besar data
Melakukan filtering, pengurutan, dan memberikan peringkat (rangking)
Membandingkan beberapa set dari data
Membuat sketsa/bagan/diagram
Menganalisis dan menemukan pola dari data
Menganalisis kecenderungan data
OLAP menerangkan sebuah kelas dari teknologi yang didesain keberadaan data adhoc dan analisis. Ketika proses umum transaksi terjadi pada hubungan database, OLAP menjadi kurang lebih sama dengan pandangan multidimensi dari data bisnis. Tampilan multidimensi ini didukung oleh teknologi multidimensi database.
OLAP adalah langkah maju yang logis dibawah pertanyaan dan laporan, dan merupakan langkah lanjut dari pembuatan sebuah keputusan solusi tambahan total. Tool software OLAP mengirim alat-alat teknologi untuk analisis bisnis komplek dengan membuat pengguna dapat menganalisa data dalam lingkungan multidimensi. Dengan tool OLAP seseorang dapat menganalisa dan me-navigasi melalui data untuk menemukan trend, titik pengecualian, dan mendapat detail tergaris bawah untuk pemahaman kemunduran yang lebih baik dan menjalankan aktivitas bisnis mereka.
OLAP merupakan suatu metode pendekatan untuk menyajikan jawaban dari  permintaan proses analisis yang bersifat dimensional secara cepat, yaitu desain dari aplikasi dan teknologi yang dapat mengoleksi, menyimpan, memanipulasi suatu data multidimensi untuk tujuan analisis.
OLAP DAN PENJADWALAN BERPRIORITAS
Berdasarkan algoritma penjadwalan berprioritas dibagi dua macam :
Statis, prioritas yang tidak berubah
Dinamis, prioritas yang bisa diubah
Pada OLAP algoritma yang digunakan adalah algoritma berprioritas dinamis karena merupakan mekanisme menanggapi perubahan lingkungan sistem saat beroperasi di lingkungan nyata. Prioritas awal yang diberikan ke proses mungkin hanya berumur pendek dalam hal ini sistem dapat menyesuaikan nilai prioritasnya ke nilai yang lebih tepat sesuai lingkungan.
Algoritma ini dituntun untuk memenuhi kebijaksanaan tertentu yang menjadi tujuan sistem komputer.
Berbagai kelebihan bisa didapat dengan menggunakan OLAP ini diantaranya :
Dapat meningkatnya produktivitas bisnis, IT developers, dan seluruh organisasi
Akses yang lebih terkendali terhadap informasi yang dapat meningkatkan efektivitas pengambilan keputusan
Mempercepat respon terhadap permintaan pasar.
Data mining adalah suatu proses yang digunakan untuk mencari informasi dan knowledge yang berguna, dimana diperoleh dari data-data yang dimiliki. Dari buku Data Mining Technique yang dikarang oleh Berry and Linoff, proses terjadinya data mining dapat dideskripsikan sebagai virtous cycle. Didasari oleh pengembangan berkelanjutan dari proses bisnis serta didorong oleh penemuan knowledge ditindaklanjuti dengan pengambilan tindakan dari penemuan tersebut.
Langkah-langkah Data mining
Identity The Business Problem
Yang pertama dan juga dasar dari virtous cycle adalah mengetahui masalah bisnis yang kita hadapi. Karena kita tidak bisa mengolah data jika kita tidak tau yang sedang kita hadapi. Kita harus mengetahui masalah-masalah apa yang sedang dihadapi. Dengan mengetahui masalah yang dihadapi kita dapat menentukan data-data mana saja yang kita butuhkan untuk dapat dilakukan tahap analisa.
Mine The Data For Actionable Information
Setelah mengetajui identifikasi masalah, kita memperolah data-data mana saja yang diperlukan untuk analisa. Barulah kita melakukan analisa terhadap data-data tersebut. Dan dari analisa tersebut analisis akan dapat memperolah sebuah knowledge baru dan baru lah dapat diambil suatu keputusan/kebijaksanaan.
Take The Action
Dan dari keputusan/kebijaksanaan yang didapat dari proses data mining itu barulah kita terapkan dengan aksi berupa tindakan-tindakan yang kongkrit/nyata dalam proses bisnis.
Measure Results
Setelah diambil tindakan-tindakan dan keputusan, kita memonitori hasil tersebut. Apakah sudah sesuai(memuaskan) dengan target2 yang ingin kita capai, apakah bisa mengatasi masalah-masalah yang dihadapi.
Teknik-teknik/Jenis-jenis DataMining
Market Basket Analysis
Himpunan data yang dijadikan sebagai objek penelitan pada area data mining. Market basket analysis adalah proses untuk menganalisis kebiasaan pelanggan dalam menyimpan item-item yang akan dibeli ke dalam keranjang belanjaannya. Market basket analysis memanfaatkan data transaksi penjualan untuk dianalisis sehingga dapat ditemukan pola berupa item-item yang cenderung muncul bersama dalam sebuah transaksi. Selanjutnya pola yang ditemukan dapat dimanfaatkan untuk merancang strategi penjualan atau pemasaran yang efektif, yaitu dengan menempatkan item-item yang sering dibeli bersamaan ke dalam sebuah area yang berdekatan, merancang tampilan item-item di katalog, merancang kupon diskon (untuk diberikan kepada pelanggan yang membeli item tertentu), merancang penjualan item-item dalam bentuk paket, dan sebagainya. Dengan menggunakan teknologi data mining, analisis data secara manual tidak diperlukan lagi.
Business Intelligence pertama kali didengungkan pada tahun 1989 oleh Howard Dresner. Dia menggambarkan istilah tersebut sebagai seperangkat konsep dan metode yang berguna untuk meningkatkan pembuatan keputusan dengan bantuan sistem yang berbasiskan fakta atau realita yang terjadi.Menurut tim studi Busines Intelligence pada Departemen Keuangan Indonesia menyatakan,Business Intelligence (BI) merupakan sistem dan aplikasi yang berfungsi untuk mengubah data-data dalam suatu perusahaan atau organisasi (data operasional, data transaksional, atau data lainnya) ke dalam bentuk pengetahuan. Aplikasi ini melakukan analisis data-data di masa lampau,  menganalisisnya dan kemudian menggunakan pengetahuan tersebut untuk mendukung keputusan dan perencanaan organisasi(Indonesia, 2007).Dari definisi itu, dapat dikatakan bahwa Business Intelligence merupakan suatu sistem pendukung keputusan yang berdasarkan pada data-data fakta kinerja perusahaan. Business Intelligence berguna untuk mengefisienkan finansial, manusia, material serta beberapa sumber daya lainya. Dalam perkembanganya banyak orang setuju bahwaBusiness Intelligence telah banyak mencakup beberapa area teknologi dan proses

Tidak ada komentar:

Posting Komentar