การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่มีประโยชน์โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ ซึ่งรวมถึงเทคนิคทางสถิติและคณิตศาสตร์
เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้วยวิธีใหม่ที่มีทั้งเหตุผลและเป็นประโยชน์ต่อเจ้าของข้อมูล
เป็นขั้นตอนของการคัดเลือก สำรวจ และจำลองข้อมูลปริมาณมากเพื่อค้นหาความสม่ำเสมอหรือความสัมพันธ์ที่ไม่เคยทราบมาก่อนเพื่อให้ได้ผลลัพธ์ที่ชัดเจนและเป็นประโยชน์สำหรับเจ้าของฐานข้อมูล
การทำเหมืองข้อมูลโดยเอาต์ซอร์ซ ทำให้งานทั้งหมดสามารถทำได้เร็วขึ้นด้วยต้นทุนการดำเนินงานที่ต่ำ บริษัทเฉพาะยังสามารถใช้เทคโนโลยีใหม่ในการบันทึกข้อมูลที่ไม่สามารถค้นหาด้วยตนเองได้ มีข้อมูลมากมายบนหลายแพลตฟอร์ม แต่เข้าถึงความรู้ที่จำกัดได้มาก
อินเทอร์เฟซการทำเหมืองข้อมูลเป็นสื่อกลางที่ช่วยให้ผู้ใช้สามารถสื่อสารกับกระบวนการทำเหมืองข้อมูลได้ เป็นการยากที่จะใช้ภาษาแบบสอบถามการทำเหมืองข้อมูล อินเทอร์เฟซผู้ใช้แบบกราฟิกสามารถใช้เพื่อสื่อสารกับระบบการทำเหมืองข้อมูล ภาษาแบบสอบถามการทำเหมืองข้อมูลสามารถใช้เป็นภาษาหลัก ซึ่งสามารถออกแบบ GUI ได้อย่างง่ายดาย
การทำเหมืองข้อมูลสามารถประกอบด้วยส่วนประกอบการทำงานดังต่อไปนี้ -
การรวบรวมข้อมูลและองค์ประกอบแบบสอบถามการทำเหมืองข้อมูล − อนุญาตให้ผู้ใช้ระบุชุดข้อมูลที่เกี่ยวข้องกับงานและเขียนแบบสอบถามการทำเหมืองข้อมูล
การนำเสนอรูปแบบที่ค้นพบ − อนุญาตให้แสดงรูปแบบที่ค้นพบในรูปแบบต่างๆ เช่น ตาราง กราฟ แผนภูมิ และเทคนิคการแสดงภาพอื่นๆ
ข้อกำหนดลำดับชั้นและการจัดการ − อนุญาตให้ทำข้อกำหนดของลำดับชั้นแนวคิด ไม่ว่าจะด้วยตนเองหรือโดยอัตโนมัติ นอกจากนี้ยังอนุญาตให้แก้ไขหรือปรับเปลี่ยนลำดับชั้นแนวคิดโดยอัตโนมัติตามการกระจายชุดข้อมูลที่กำหนด
การจัดการการขุดข้อมูลเบื้องต้น − ช่วยให้สามารถปรับการดำเนินการขุดข้อมูลได้อย่างมีประสิทธิภาพ เช่น การเลือก การแสดง และการเปลี่ยนแปลงลำดับชั้นแนวคิด
การขุดหลายระดับแบบโต้ตอบ − เปิดใช้งานการม้วนขึ้นหรือการเจาะลึกบนรูปแบบที่ระบุ การออกแบบอินเทอร์เฟซการทำเหมืองข้อมูลควรพิจารณาถึงคลาสต่างๆ ของผู้ใช้ด้วย ผู้ใช้ระบบการทำเหมืองข้อมูลสามารถจำแนกได้ เช่น นักวิเคราะห์ธุรกิจและผู้บริหารธุรกิจ
นักวิเคราะห์ธุรกิจต้องการความยืดหยุ่นและความสะดวกในการเลือกส่วนต่างๆ ของข้อมูล การจัดการมิติข้อมูล และการปรับแต่งกระบวนการขุดข้อมูล ในทางกลับกัน ผู้บริหารธุรกิจต้องการการนำเสนอและการตีความผลการขุดข้อมูลที่ชัดเจน การผสานรวมผลการขุดข้อมูลเข้ากับกระบวนการเขียนรายงานและการนำเสนออย่างง่ายดาย ระบบการทำเหมืองข้อมูลที่ออกแบบมาอย่างดีควรมีอินเทอร์เฟซที่ใช้งานง่ายสำหรับผู้ใช้ทั้งสองประเภท