Sunday, 19 July 2015

Perbedaan data mart dan data warehouse

Perbedaan data mart dan data warehouse
                               
           Kadang kala kita sulit untuk membedakan antara data warehouse dan data mart karena keduanya hampir sama. Namun, jika dikaji lebih jauh ada beberapa perbedaan yang dimiliki keduanya. Data warehouse merupakan gabungan dari beberapa data mart dan levelnya berada pada perusahaan atau organisasi. Sedangkan data mart merupakan bagian dari datawarehouse dan berada level departemen pada perusahaan atau organisasi tersebut. Data mart menangani sebuah business proses, misalkan penjualan, maka hanya proses penjualan saja yang ditangani pada data mart, Perbandingan antara data warehouse dan data mart dapat dilihat pada tabel berikut ini:



Keuntuangan dan kerugian menggunakan data mart

>  Keuntungan
          Data mart dapat meningkatkan waktu respon pengguna akhir, karena berisi data mentah yang memungkinkan sistem komputer untuk fokus pada satu tugas, sehingga meningkatkan kinerja. Berbeda dengan sistem OLTP, data mart juga dapat menyimpan data historis yang memungkinkan pengguna untuk menganalisis kecenderungan data. Selain itu, data mart tidak begitu mahal dan kompleks sebagai data gudang untuk setup dan melaksanakan karena masalah teknis tidak begitu sulit untuk diselesaikan.
ž
  >Kerugian

ž  Mereka memiliki nilai yang terbatas karena mereka tidak dapat melihat organisasi secara keseluruhan dan pelaporan dan analisis potensi terbatas.

DATA MART


Pengertian data mart
        Data mart kadang-kadang dirancang sebagai gudang data individu dan memberikan kontribusi pada organisasi secara keseluruhan sebagai anggota dari sebuah gudang data terdistribusi. Dalam desain yang lain, data mart menerima data dari sebuah gudang master data melalui update berkala, dalam hal ini fungsionalitas data mart sering terbatas pada layanan presentasi untuk klien.
           Data mart harus dirancang dari perspektif bahwa mereka adalah komponen dari data warehouse terlepas dari fungsi masing-masing atau konstruksi. Ini menyediakan konsistensi dan kegunaan dari informasi seluruh organisasi

Beberapa contoh produk data mart adalah sebagai berikut:
ž  SmartMart (IBM)
ž  Visual Warehouse (IBM)
ž  PowerMart (Informatica)

Dalam pembangunan data mart, terdapat 2 arsitektur, yaitu :
ž  Dependent Data Mart
ž  Independent Data Mart (IDM)

Karakteristik data mart
       Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
       Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse.
       Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami.
       Data marts bisa bersifat dependent atau independent.
       Kubus

       Aggregation

PENGENALAN DATA MINING


        Merupakan sebuah hal yang penting untuk menjelaskan apa arti dari Istilah Data Mining. Istilah Data Mining disini berarti sebuah proses menganalisa data untuk mencari pola-pola tersembunyi dengan menggunakan metodologi otomatis, nah proses yang seperti ini sering kali juga disebut dengan istilah lain,
        
        seperti Machine Learning, Knowledge Discovery in Database (KDD), atau Predictive Analytics. Jangan dibingungkan oleh istilah-istilah tersebut, walaupun berbeda, tetapi fungsinya tetap sama.
Saat ini istilah yang terpopuler adalah Predictive Analytics, tetapi ironisnya beberapa perusahaan menggunakan istilah tersebut untuk membedakan Predictive Analytics dari proses Data Mining yang mereka lakukan (tapi ingat, pada hakikatnya ini adalah proses yang sama).

           Menurut mereka, proses Data Mining terbatas hanya pada pencarian pola, sedangkan Predictive analytics dapat menggunakan pola yang didapat dari data mining untuk menghubungkan atau meramalkan suatu nilai yang belum diketahui.

        Nah sekarang, apa sih yang dapat dilakukan dengan Data Mining, dan kenapa anda membutuhkannya? Mari kita bahas disini.

Anda pasti tahu bahwa belakangan ini kekuatan penghitungan processor sangat meningkat secara signifikan, kapasitas media penyimpanan seperti harddisk juga meningkat tajam dan dengan harga yang sangat lebih terjangkau, akibatnya kemampuan untuk menyimpan data berlari lebih cepat daripada kemampuan untuk memproses data pada media penyimpanan tersebut.

          Ini menjadikan data-data yang telah terkumpul hanya terdiam di dalam database, kebanyakan data-data ini datang dari perangkat lunak bisnis, seperti aplikasi finansial, Sistem Enterprise Resource Planning (ERP), Sistem Customer Relationship Management (CRM), dan lainnya.

         Data-data yang diam terkumpul tersebut seringkali luput dari perhatian, perusahaan biasanya sudah merasa aman punya data, akan tetapi mereka yang tidak melakukan proses data mining sebenarnya kaya akan data tapi miskin informasi akan data-data yang mereka miliki. Nah disini tujuan utama dari Data Mining, yaitu untuk mengangkat informasi yang ada pada data-data yang telah dikumpulkan, dan membuat informasi tersebut menjadi sesuatu yang berguna bagi perusahaan atau organisasi.