Data Mining - Apa itu Data Mining? Data Mining merupakan acara - acara pengumpulan, Pemakaian data historis untuk menemukan keteraturan, kekerabatan dan pola dalam set data yang berukuran besar. Namun berdasarkan dari sumber tertentu dari lainnya yaitu Data Mining yakni proses - proses yang memakai teknik matematika, statistik, kecerdasan buatan, machine learning untuk mengidentifikasi informasi dan mengekstraksi yang bermanfaat dan pengetahuan yang terkait dari banyak sekali database besar (Turban dkk, 2005), Terdapat beberapa istilah lainnya yang mempunyai makna sama dengan data mining, yaitu Knowledge discovery in databases (KDD), ekstraksi pengetahuan (knowledge extraction), kecerdasan bisnis (business intelligence), analisa data/pola (data/pattern analysis), data archaeolgy, dan data dredging (Larose, 2005)
Kemampuan dari Data Mining tersebut unutk mencari informasi - informasi bisnis yang sangat berharga dari basis data yang sangat besar, dan sanggup dianalogikan dengan penambangan logam mulia dari lahan sumbernya, teknologi ini digunakan sebagai untuk :
1. Menentukan prediksi ekspresi dominan dan sifat - sifat bisnis, dimana data mining akan mengotomatisasi proses pencarian informasi pemprediksi di dalam suatu basis data yang besar.
2. Penemuan pola - pola yang tidak diketahui sebelumnya, dimana pada data mining menyapu sebuah basis data, lalu mengidentifikasikan pola - pola yang sebelumnya tersembunyi dalam satu sapuan.
3. Data Mining berkhasiat dalam untuk menciptakan suatu keputusan yang sangat kritis, terutama dalam rancangan seni administrasi bisnis.
Beberapa Definisi Data Mining dari Sumber (Larose, 2005) :
1. Data Mining yakni proses untuk menemukan sesuatu yang bermakna dari suatu kekerabatan baru, tren dan pola yang ada dengan cara memilah - milah data berukuran besar yang disimpan dalam repositori, dengan memakai teknologi pengenalan pola serta teknik statistik dan matematika.
2. Data Mining yakni suatu pengamatan analisa database untuk menemukan suatu kekerabatan yang tidak terduga dan untuk meringkas data dengan cara atau memakai metode gres yang sanggup dimengerti dan bermanfaat kepada pemilik data.
3. Data Mining merupakan suatu bidang ilmu interdisipliner yang menyatukan teknik pembelajaran dari mesin (machine learning), statistik, database, pengenalan pola (pattern recognition), dan visualisasi untuk mengatasi suatu persoalan ekstraksi informasi dari suatu basis data yang besar.
4. Data mining sanggup diartikan sebagai suatu proses ekstraksi informasi yang berkhasiat dan sangat potensial dari sekumpulan data yang terdapat secara implisit dalam suatu basis data.
Fungsi dari Data Mining
Data Mining ini mempunyai beberapa fungsi yang sangat penting untuk membantu mendapat sebuah informasi yang berkhasiat serta untuk meningkatkan pengetahuan bagi pengguna. Pada dasarnya, data mining ini mempunyai atau mempunyai empat fungsi dasar menyerupai yaitu :
1. Prediksi (Prediction), Fungsi prediksi ini yaitu proses untuk menemukan pola dari data dengan memakai beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui jenisnya atau nilainya.
2. Deskripsi (Description), Fungsi ini yaitu proses untuk menemukan suatu atau beberapa karakteristik penting dari data dalam suatu basis data.
3. Klasifikasi (Classification), Fungsi ini yaitu merupakan suatu proses untuk menemukan beberapa model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta sanggup meramalkan kecenderungan pada data di masa depan yang akan datang.
4. Asosiasi (Association), Fungsi ini yaitu proses yang digunakan untuk menemukan sebuah atau suatu kekerabatan yang terdapat pada nilai atribut dari sekumpulan data.
Proses Data Mining
Proses - proses pada Data Mining ini yang pada umumnya dilakukan antara lain : estimasi, prediksi, deskripsi, clustering, klasifikasi, dan asosiasi. Secara rinci dari proses data mining ini berdasarkan sumber dari (Larose, 2005) sebagai berikut :
A. Deskripsi
Deskripsi ini mempunyai tujuan yaitu untuk mengidentifikasi pola yang muncul secara berulang pada suatu data dan akan mengubah pola tersebut menjadi hukum dan kriteria yang sanggup gampang dimengerti oleh para andal pada domain aplikasinya. Aturan yang akan dihasilkan harus gampang dimengerti juga semoga sanggup berjalan efektif meningkatkan tingkat pengetahuan pada sistem. Tugas dari deskriptif ini merupakan kiprah data mining yang paling sering dibutuhkan pada teknik postprocessing untuk melaksanakan sebuah validasi dan menjelaskan hasil dari proses data mining. Postprocessing juga merupakan proses yang akan digunakan untuk memastikan hanya hasil yang valid dan berkhasiat yang sanggup digunakan oleh pihak berkepentingan.
B. Prediksi
Prediksi ini mempunyai kemiripan dengan klasifikasi, akan tetapi data tersebut diklasifikasikan berdasarkan nilai atau sikap yang akan diperkirakan pada masa yang akan daatang. Contohnya saja dddari kiprah prediksi ini contohnya menyerupai untuk memprediksikan adanya pengurangan dari jumlah pelanggan dalam waktu akrab dan prediksi harga saham dalam waktu tiga bulan yang akan mendatang.
C. Estimasi
Estimasi ini juga hampir sama dengan prediksi, kecuali variabel sasaran estimasi ini lebih mengarah atau ke arah numerik dari pada ke arah kategorinya. Model ini dibangun dengan memakai record lengkap yang menyediakan nilai dari suatu variabel sasaran sebagai nilai prediksinya. Selanjutnya yaitu,, pada peninjauan berikuut dari estimasi nilai dari variabel sasaran tersebut dibentuk dengan berdasarkan nilai variabel prediksi. Sebagai contohnya yaitu akan dilakukannya estimasi tekanan darah sistolik pada suatu pasien di rumah sakit berdasarkan umur pasien, berat badan, jenis kelamin, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan sebuah model estimasi.
D. Klasifikasi
Klasifikasi yaitu merupakan sebuah proses untuk menemukan model atau fungsi yang akan mendeskripsikan dan membedakan data ke dalam kelas - kelas. Klasifikasi ini melibatkan proses investigasi karakteristik dari suatu objek dan memasukkan objek tersebut kedalam salah satu kelas yang sudah di definisikan sebelumnya.
E. Clustering
Clustering ini merupakan pengelompokan data tanpa berdasarkan kelas data tertentu ke dalam kelas objek yang sama. Sebuah kluster yakni yaitu dari kumpulan sebuah record yang mempunyai kemiripan suatu dengan yang lainnya dan mempunyai ketidakmiripan dengan record dalam kluster lainnya. Tujuannya yakni untuk menghasilkan pengelompokan objek data yang menyerupai satu usama lain dengan kelompok - kelompok. Semakin besar objek dalam suatu cluster dan semakin besar pula perbedaan tiap cluster maka kualitas analisis cluster juga akan semakin baik.
F. Asosiasi
Tugas dari Asosiasi dalam data mining yakni yaitu untuuk menemukan atribut yang muncul dalam suatu waktu. Di dalam dunia bisnis lebih umum disebut dengan analisis keranjang belanja (market basket analysis). Tugas Asosiasi ini berusaha untuuk mengungkapkan hukum untuk mengukur suatu kekerabatan antara dua atau lebih atribut.
Tahapan pada Data Mining
Tahapan - tahapan yang dilakukan pada proses data mining ini akan diawali dari seleksi data dari data sumber ke data target, tahap preprocessing ini untuk memperbaiki kualitas data, transformasi, data mining serta tahap interpretasi dan penilaian yang akan menghasilkan output berupa pengetahuan yang gres yang akan diperlukan memperlihatkan bantuan yang lebih baik lagi. Secara detail akan dijelaskan dari beberapa sumber sebagai berikut (Fayyad, 1996) :
1. Data Selection
Tahapan Data Selection atau pemilihan (seleksi) data dari suatu sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi - informasi dalam KDD dimulai. Data hasil seleksi ini yang akan digunakan untuk proses data mining, akan disimpan dalan suatu berkas, terpisah dari basis data operasional.
2. Pre-Processing / Cleaning
Sebelum proses suatu data mining sanggup dilaksanakan, perlu untuuk dilakukannya proses cleaning pada data yang akan menjadi fokus KDD. Proses cleaning ini meliputi antara lain yaitu membuang duplikasi yang ada pada data, mengusut data yang inkonsisten, dan memperbaiki kesalahan - kesalahan pada data.
3. Transformation
Transformation atau Coding yakni proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai uuntuk proses data mining. Proses Coding didalam KDD merupakan proses yang kreatif dan sangat tergantung dengan jenis atau pola informasi yang akan dicari dalam basis data.
4. Data Mining
Data mining yakni proses untuk mencari pola atau informasi menarik didalam data terpilih dengan memakai teknik atau beberapa metode tertentu. Metode, teknik atau algoritma pada data mining ini sangat bervariasi. Pemilihan metode atau algoritma yang sempurna sangat bergantung pada proses dan tujuan KDD tersebut secara keseluruhan.
5. Evalution / Interpretation
Pada tahap ini pola informasi yang dihasilkan dari proses data mining perlu ditampilkan didalam bentuk yang gampang dimengerti baik oleh pihak yang berkepentingan. Tahap ini merupakan bab dari proses KDD yang disebut dengan Interpretation. Tahap Interpretation ini meliputi dari investigasi apakah pola atau informasi tersebut yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
Nah itulah beberapa Pengertian, Tahapan dan Fungsi dari sebuah Data Mining. Informasi - informasi diatas itu yakni diambil dari beberapa buku. Kaprikornus silahkan anda membaca atau membelinya buku tersebut semoga lebih mengerti dan sanggup dipahami secara mendetail apa itu Data Mining dan cara melaksanakan proses - proses data mining. Sekian artikel dari kami, gampang - mudahan artikel ini bermanfaat untuk kita semua yang telah membaca. Terimakasih.
Daftar Pustaka :
- Turban, E, 2005, Decision Support Systems and Intelligent Systems Edisi Bahasa Indonesia Jilid 1, Andi:Yogyakarta.
- Larose, Daniel T, 2005, Discovering Knowledge in Data : An Introduction to Data Mining, John Willey & Sons, Inc.
- Ayyad, Usama, 1996. Advances in Knowledge Discovery and Data Mining, MIT Press.
Sumber https://soymedia.blogspot.com/