Data Mining yaitu suatu istilah yang dipakai untuk menguraikan inovasi pengetahuan di dalam database. Data mining yaitu proses yang memakai teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi gosip yang bermanfaat dan pengetahuan yang terakit dari banyak sekali database besar (Turban, 2005).
Secara umum data mining mempunyai empat kiprah utama (Sahu, Shrma & Gondhalakar, 2011):
Secara umum data mining mempunyai empat kiprah utama (Sahu, Shrma & Gondhalakar, 2011):
Klasifikasi (Classification)
Klasifikasi bertujuan untuk mengklasifikasikan item data menjadi satu dari beberapa kelas standar. Sebagai contoh, suatu aktivitas email sanggup mengklasifikasikan email yang sah dengan email spam. Beberapa algoritma pembagian terstruktur mengenai antara lain pohon keputusan, nearest neighbor, nave bayes, neural networks dan support vector machines.
Regresi (Regression)
Regresi merupakan pemodelan dan pemeriksaan relasi dua atau lebih variabel. Dalam analisis regresi ada satu atau lebih variabel independent atau prediktor yang biasa diwakili dengan notasi X dan satu variabel respon yang biasa diwakili dengan notasi Y (Santosa, 2007).
Pengelompokan (Clustering)
Clustering merupakan metode pengelompokan sejumlah data ke dalam klaster (group) sehingga dalam setiap klaster berisi data yang semirip mungkin.
Pembelajaran Aturan Asosiasi (Association Rule Learning)
Pembelajaran hukum asosiasi mencari relasi antara variabel. Sebagai teladan suatu toko mengumpulkan data kebiasaan pelanggan dalam berbelanja. Ketika memakai pembelajaran hukum asosiasi, toko tersebut sanggup menentuan produk yang sering dibeli bersamaan dan memakai gosip ini untuk tujuan pemasaran.
Daftar Pustaka
Santosa, B., 2007, Data mining Terapan, GrahaIlmu, Surabaya
Turban, E., dkk, 2005, Decicion Support Systems and Intelligent Systems, Andi Offset, Yogyakarta
Tidak ada komentar:
Posting Komentar