Kamis, 12 Juli 2018

Crisp-Dm

CRISP-DM (CRoss-Industry Standard Process for Data Mining) merupakan suatu konsorsium perusahaan yang didirikan oleh Komisi Eropa pada tahun 1996 dan telah ditetapkan sebagai proses standar dalam data mining yang sanggup diaplikasikan di aneka macam sektor industri. Gambar menjelaskan wacana siklus hidup pengembangan data mining.

Berikut ini ialah enam tahap siklus hidup pengembangan data mining (Chapman dkk, 2000) :
    1. Business Understanding
Tahap pertama ialah memahami tujuan dan kebutuhan dari sudut pandang bisnis, lalu menterjemahkan pengetahuan ini ke dalam pendefinisian persoalan pada data mining. Selanjutnya akan ditentukan rencana dan taktik untuk mencapai tujuan tersebut.

    2. Data Understanding
Tahap ini dimulai dengan pengumpulan data yang lalu akan dilanjutkan dengan proses untuk mendapat pemahaman yang mendalam wacana data, mengidentifikasi persoalan kualitas data, atau untuk mendeteksi adanya bab yang menarik dari data yang sanggup dipakai untuk hipotesa untuk warta yang tersembunyi.

    3. Data Preparation
Tahap ini meliputi semua acara untuk membangun dataset final (data yang akan diproses pada tahap pemodelan) dari data mentah. Tahap ini sanggup diulang beberapa kali. Pada tahap ini juga meliputi pemilihan tabel, record, dan atribut-atribut data, termasuk proses pencucian dan transformasi data untuk lalu dijadikan masukan dalam tahap pemodelan.

    4. Modelling
Dalam tahap ini akan dilakukan pemilihan dan penerapan aneka macam teknik pemodelan dan beberapa parameternya akan diadaptasi untuk mendapat nilai yang optimal. Secara khusus, ada beberapa teknik berbeda yang sanggup diterapkan untuk persoalan data mining yang sama. Di pihak lain ada teknik pemodelan yang membutuhan format data khusus. Sehingga pada tahap ini masih memungkinan kembali ke tahap sebelumnya.

    5. Evaluation
Pada tahap ini, model sudah terbentuk dan diperlukan mempunyai kualitas baik jikalau dilihat dari sudut pandang analisa data. Pada tahap ini akan dilakukan penilaian terhadap keefektifan dan kualitas model sebelum dipakai dan memilih apakah model sanggup mencapat tujuan yang ditetapkan pada fase awal (Business Understanding). Kunci dari tahap ini ialah memilih apakah ada persoalan bisnis yang belum dipertimbangkan. Di final dari tahap ini harus ditentukan penggunaan hasil proses data mining.

    6. Deployment
Pada tahap ini, pengetahuan atau warta yang telah diperoleh akan diatur dan dipresentasikan dalam bentuk khusus sehingga sanggup dipakai oleh pengguna. Tahap deployment sanggup berupa pembuatan laporan sederhana atau mengimplementasikan proses data mining yang berulang dalam perusahaan. Pada banyak kasus, tahap deployment melibatkan konsumen, di samping analis data, alasannya ialah sangat penting bagi konsumen untuk memahami tindakan apa yang harus dilakukan untuk memakai model yang telah dibuat.
  
Daftar Pustaka
Chapman, P., dkk, 2000, CRISP-DM v.1.0 Step-by-step Data Mining Guide, SPSS, USA

Tidak ada komentar:

Posting Komentar