A.     
Penambangan
data adalah suatu disiplin ilmu yang berfokus pada pemrosesan data menjadi
suatu informasi yang memiliki nilai. Kenyataannya struktur data sangat beragam,
dan dibutuhkan suatu disiplin ilmu yang fokus dalam mengolah data menjadi
informasi yang dapat dimanfaatkan.

B.     
Penambangan
teks dan information retrieval adalah kedua ilmu yang mempelajari cara
mendapatkan informasi dari data yang tidak memiliki makna, akan tetapi
information retrieval berfokus dalam menemukan metode terbaik untuk mendapatkan
hasil,

We Will Write a Custom Essay Specifically
For You For Only $13.90/page!


order now

C.      
Pada
NLP, data dapat disusun menjadi suatu bagian yang memiliki makna, berbeda
dengan teks mining yang lebih fokus pada statistik dari teks yang berhasil
didapatkan.

D.     
Berbeda
jenis data yang digunakan, basis data adalah data yang telah disusun dan
digunakan sedemikian rupa sehingga mudah digunakan oleh pengguna, akan tetapi
teks mining biasanya menggunakan data yang cenderung acak namun memiliki pola
yang dapat ditemukan.

E.      
Teks
mining dapat lebih dikembangkan dengan metode-metode machine learning, seperti
menemukan pattern-pattern yang sulit dimengerti manusia, memproses data yang
miliaran maupun triliunan.

F.      
Data
mining adalah salah satu teknik yang digunakan dalam data warehouse, dalam data
warehouse diperlukan suatu sistem yang cerdas yang dapat memproses data dengan
akurat, maka digunakanlah teknik data mining, biasanya dalam data warehouse,
data mining disandingkan dengan kecerdasan buatan yang mumpuni untuk menyelesaikan
masalah.

2)           Kesamaan
antara proses mining dan querying adalah kedua teknik tersebut dilakukan untuk
mendapatkan suatu informasi tertentu berdasarkan data. Akan tetapi, data yang
dilakukan proses query biasanya telah terstruktur dan rapi, sehingga program
akan jauh lebih mudah memproses. Pada data yang tidak beraturan atau teks yang
rumit, penambangan informasi perlu dilakukan karena query tidak dapat menangani
data yang rumit.

3)           Dikatakan
efektif jika program dapat menghasilkan suatu solusi dari masalah yang
diberikan. Dikatakan efisien jika penggunaan waktu dan ruang lebih singkat.
Untuk mengukur efektivitas adalah dengan melakukan uji, baik berupa uji
blackbox maupun whitebox. Untuk menguji efisiensi adalah dengan menghitung
kompleksitas ruang dan waktu dari algoritma tersebut.