Data Mining sebagai proses penemuan pengetahuan (Knowledge Discovery)
Data Mining tidak digunakan untuk industri tertentu saja tetapi hampir di semua bidang. Data Mining memerlukan kemampuan teknologi intelijen untuk menelusuri pengetahuan yang tersembunyi di dalam data. Sebagian besar organisasi/perusahaan menerapkan teknologi data mining untuk melakukan hal-hal berikut ini :
1. Menemukan Pengetahuan Baru (Knowledge Discovery)
Tujuan dari Knowledge Discovery adalah untuk menemukan hubungan, pola, dan korelasi yang tersembunyi di dalam data-data perusahaan.
2. Menampilkan Data (Visualize Data)
Analis harus bisa peka terhadap informasi-informasi yang sangat banyak yang tersimpan di dalam basis data perusahaan. Sebelum membuat analisa yang harus dilakukan adalah menampilkan informasi dari data tersebut dalam bentuk yang sesuai yang dapat dimengerti dengan mudah.
3. Memperbaiki Data (Correct Data)
Banyak perusahaan yang memiliki data-data yang tidak lengkap, beberapa diantaranya bahkan ada data yang salah atau data yang kontradiktif. Teknik data mining dapat membantu mengenali dan memperbaiki data-data tersebut dengan cara yang konsisten dan sebaik mungkin.
Proses Knowledge Discovery meliputi data-data operasional yang ada di dalam basis data dibentuk ke dalam data warehouse. Proses pembentukan ini dinamakan Data Cleaning. Data Cleaning menghasilkan ringkasan data (summary) di dalam data warehouse. Data di dalam data warehouse sangatlah besar sehingga sulit bagi seorang analis untuk menganalisa secara langsung.
Kemudian analis akan melakukan proses data selection (seleksi data) untuk menentukan data manakah yang relevan mana yang tidak. Data-data yang relevan disebut dengan Task Relevant Data. Sampai dengan tahap ini belum dilakukan proses data mining sekalipun. Bila Task Relevan Data sudah tersedia barulah dilakukan proses data mining terhadap data-data tersebut. Hasil dari proses data mining adalah sebuah pattern (pola) hasil evaluasi. Bila pola tersebut tidak sesuai harapan maka proses ini bisa diulang dari proses sebelumnya. Kemudian proses ini diterapkan pada basis data perusahaan.
Data Mining tidak digunakan untuk industri tertentu saja tetapi hampir di semua bidang. Data Mining memerlukan kemampuan teknologi intelijen untuk menelusuri pengetahuan yang tersembunyi di dalam data. Sebagian besar organisasi/perusahaan menerapkan teknologi data mining untuk melakukan hal-hal berikut ini :
1. Menemukan Pengetahuan Baru (Knowledge Discovery)
Tujuan dari Knowledge Discovery adalah untuk menemukan hubungan, pola, dan korelasi yang tersembunyi di dalam data-data perusahaan.
2. Menampilkan Data (Visualize Data)
Analis harus bisa peka terhadap informasi-informasi yang sangat banyak yang tersimpan di dalam basis data perusahaan. Sebelum membuat analisa yang harus dilakukan adalah menampilkan informasi dari data tersebut dalam bentuk yang sesuai yang dapat dimengerti dengan mudah.
3. Memperbaiki Data (Correct Data)
Banyak perusahaan yang memiliki data-data yang tidak lengkap, beberapa diantaranya bahkan ada data yang salah atau data yang kontradiktif. Teknik data mining dapat membantu mengenali dan memperbaiki data-data tersebut dengan cara yang konsisten dan sebaik mungkin.
Proses Knowledge Discovery meliputi data-data operasional yang ada di dalam basis data dibentuk ke dalam data warehouse. Proses pembentukan ini dinamakan Data Cleaning. Data Cleaning menghasilkan ringkasan data (summary) di dalam data warehouse. Data di dalam data warehouse sangatlah besar sehingga sulit bagi seorang analis untuk menganalisa secara langsung.
Kemudian analis akan melakukan proses data selection (seleksi data) untuk menentukan data manakah yang relevan mana yang tidak. Data-data yang relevan disebut dengan Task Relevant Data. Sampai dengan tahap ini belum dilakukan proses data mining sekalipun. Bila Task Relevan Data sudah tersedia barulah dilakukan proses data mining terhadap data-data tersebut. Hasil dari proses data mining adalah sebuah pattern (pola) hasil evaluasi. Bila pola tersebut tidak sesuai harapan maka proses ini bisa diulang dari proses sebelumnya. Kemudian proses ini diterapkan pada basis data perusahaan.