การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่มีความหมายโดยการเปลี่ยนผ่านข้อมูลจำนวนมากที่จัดเก็บไว้ในที่เก็บข้อมูล โดยใช้เทคโนโลยีการรู้จำรูปแบบ ตลอดจนเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลเชิงสังเกตเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัยและเพื่อสรุปข้อมูลด้วยวิธีใหม่ๆ ที่ทั้งเข้าใจได้และเป็นประโยชน์ต่อเจ้าของข้อมูล
เป็นขั้นตอนของการเลือก สำรวจ และจำลองข้อมูลปริมาณมากเพื่อค้นหาความสม่ำเสมอหรือความสัมพันธ์ที่ไม่เคยทราบมาก่อนเพื่อให้ได้ผลลัพธ์ที่ชัดเจนและเป็นประโยชน์สำหรับเจ้าของฐานข้อมูล การทำเหมืองข้อมูลเป็นขั้นตอนของการสำรวจและวิเคราะห์โดยใช้ข้อมูลปริมาณมหาศาลแบบอัตโนมัติหรือกึ่งอัตโนมัติเพื่อค้นหาการออกแบบและวิธีการที่มีความหมาย
การทำเหมืองข้อมูลเป็นวิธีการสำคัญที่ดึงข้อมูลที่ไม่รู้จักและอาจมีประโยชน์ก่อนหน้านี้จากข้อมูลจำนวนมหาศาล กระบวนการขุดข้อมูลประกอบด้วยองค์ประกอบหลายอย่าง และส่วนประกอบเหล่านี้ประกอบเป็นโครงสร้างระบบการทำเหมืองข้อมูล องค์ประกอบหลักของการทำเหมืองข้อมูลมีดังนี้ -
-
ที่เก็บข้อมูล − นี่คือหนึ่งหรือชุดของฐานข้อมูล คลังข้อมูล สเปรดชีต หรือที่เก็บข้อมูลหลายประเภท การล้างข้อมูลและเทคนิคการรวมข้อมูลสามารถนำมาใช้กับข้อมูลได้
-
ฐานข้อมูลหรือเซิร์ฟเวอร์คลังข้อมูล − ฐานข้อมูลหรือเซิร์ฟเวอร์คลังข้อมูลเป็นคำตอบสำหรับการดึงข้อมูลที่เกี่ยวข้อง โดยขึ้นอยู่กับคำขอการขุดข้อมูลของผู้ใช้
-
ฐานความรู้ − นี่คือความรู้ในโดเมนที่สามารถใช้เป็นแนวทางในการค้นหาหรือคำนวณความน่าสนใจของการออกแบบที่ได้
-
เครื่องมือขุดข้อมูล − สิ่งนี้มีความสำคัญต่อระบบการทำเหมืองข้อมูลและประกอบด้วยชุดของโมดูลการทำงานสำหรับงานต่างๆ รวมถึงการวิเคราะห์ลักษณะเฉพาะ การวิเคราะห์การเชื่อมโยงและความสัมพันธ์ การจำแนกประเภท การทำนาย การวิเคราะห์คลัสเตอร์ การวิเคราะห์ค่าผิดปกติ และการวิเคราะห์วิวัฒนาการ
-
โมดูลการประเมินรูปแบบ − องค์ประกอบนี้โดยทั่วไปใช้มาตรการความน่าสนใจและสื่อสารกับโครงสร้างการขุดข้อมูลเพื่อมุ่งเน้นการค้นหาไปสู่การออกแบบที่น่าสนใจ
โดยทั่วไป กลุ่มนี้ใช้มาตรการสเตคที่ร่วมมือกับโมดูลการทำเหมืองข้อมูลเพื่อกำหนดเป้าหมายการค้นหาไปสู่การออกแบบที่น่าสนใจ สามารถใช้เกณฑ์เดิมพันเพื่อกรองการออกแบบที่ค้นพบได้
ในอีกแง่หนึ่ง โมดูลการประเมินรูปแบบสามารถประสานงานกับโมดูลการขุด ตามการดำเนินการของเทคนิคการทำเหมืองข้อมูลที่ใช้ สำหรับการทำเหมืองข้อมูลที่มีประสิทธิภาพ ขอแนะนำให้ผลักดันการประเมินรูปแบบการเดิมพันให้มากที่สุดเท่าที่จะเป็นไปได้ในกระบวนการขุดเพื่อจำกัดการค้นหาไว้เฉพาะการออกแบบที่น่าสนใจเท่านั้น
-
ส่วนต่อประสานผู้ใช้ − โมดูลนี้เชื่อมต่อผู้ใช้กับระบบการทำเหมืองข้อมูล ทำให้ผู้ใช้สามารถโต้ตอบกับระบบโดยการกำหนดคำค้นหาหรืองานการทำเหมืองข้อมูล การให้ข้อมูลเพื่อช่วยมุ่งเน้นการค้นหา และใช้การทำเหมืองข้อมูลเชิงสำรวจโดยพิจารณาจากผลการทำเหมืองข้อมูลระดับกลาง
นอกจากนี้ คอมโพเนนต์นี้ยังให้ผู้ใช้เรียกดูฐานข้อมูลและการออกแบบคลังข้อมูลหรือโครงสร้างข้อมูล ประเมินรูปแบบที่ขุดได้ และแสดงภาพรูปแบบในรูปแบบต่างๆ