การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้วยวิธีใหม่ที่มีทั้งเหตุผลและเป็นประโยชน์ต่อเจ้าของข้อมูล
งานการทำเหมืองข้อมูลสามารถกำหนดได้ในการออกแบบแบบสอบถามการทำเหมืองข้อมูล ซึ่งเป็นการป้อนข้อมูลเข้าสู่ระบบการทำเหมืองข้อมูล แบบสอบถามการทำเหมืองข้อมูลจะแสดงในเงื่อนไขเบื้องต้นของงานการทำเหมืองข้อมูล พื้นฐานเหล่านี้ทำให้ผู้ใช้สามารถเชื่อมต่อกับระบบการทำเหมืองข้อมูลระหว่างการค้นพบเพื่อควบคุมกระบวนการทำเหมืองหรือทดสอบสิ่งที่ค้นพบจากหลายมุมหรือความลึก
งานของการขุดข้อมูลมีดังนี้ -
ชุดข้อมูลที่เกี่ยวข้องกับงานที่จะขุด − สิ่งนี้กำหนดส่วนต่าง ๆ ของฐานข้อมูลหรือชุดของข้อมูลที่เกี่ยวข้องกับผู้ใช้ สิ่งนี้เกี่ยวข้องกับแอตทริบิวต์ฐานข้อมูลหรือมิติคลังข้อมูลที่สนใจ (กำหนดเป็นแอตทริบิวต์หรือมิติที่เกี่ยวข้อง)
ชนิดของความรู้ที่จะขุด − สิ่งนี้กำหนดฟังก์ชันการขุดข้อมูลที่จะดำเนินการ รวมถึงการกำหนดลักษณะเฉพาะ การเลือกปฏิบัติ การวิเคราะห์การเชื่อมโยงหรือความสัมพันธ์ การจำแนกประเภท การทำนาย การจัดกลุ่ม การวิเคราะห์ค่าผิดปกติ หรือการวิเคราะห์วิวัฒนาการ
ความรู้พื้นฐานที่จะใช้ในกระบวนการค้นพบ − ความรู้เกี่ยวกับโดเมนที่จะขุดช่วยชี้นำกระบวนการค้นพบความรู้และสำหรับการคำนวณรูปแบบที่กำหนดไว้ ลำดับชั้นของแนวคิดเป็นรูปแบบความรู้พื้นฐานที่มีชื่อเสียง ซึ่งช่วยให้สามารถขุดข้อมูลด้วยวิธีนามธรรมต่างๆ ได้หลากหลาย
การวัดความน่าสนใจและเกณฑ์สำหรับการประเมินรูปแบบ − สามารถใช้เพื่อเป็นแนวทางในกระบวนการขุดหรือหลังจากค้นพบแล้ว เพื่อคำนวณรูปแบบที่ค้นพบ ความรู้หลายประเภทอาจมีมาตรการที่น่าสนใจที่แตกต่างกัน
การแสดงภาพที่คาดหวังสำหรับการแสดงภาพรูปแบบที่ค้นพบ − นี่แสดงถึงรูปแบบที่จะนำเสนอรูปแบบที่ค้นพบ ซึ่งอาจประกอบด้วยกฎ ตาราง แผนภูมิ กราฟ ต้นไม้การตัดสินใจ และลูกบาศก์
ภาษาแบบสอบถามการทำเหมืองข้อมูลสามารถออกแบบให้รวมเอาพื้นฐานเหล่านี้ ทำให้ผู้ใช้สามารถเชื่อมต่อกับระบบการทำเหมืองข้อมูลได้อย่างยืดหยุ่น ภาษาแบบสอบถามการทำเหมืองข้อมูลสนับสนุนอำนาจที่สามารถสร้างส่วนต่อประสานกราฟิกที่ใช้งานง่าย สิ่งนี้ส่งเสริมการสื่อสารของระบบการทำเหมืองข้อมูลกับระบบข้อมูลอื่นๆ และการรวมเข้ากับสภาพแวดล้อมการประมวลผลข้อมูลที่สมบูรณ์
กำลังออกแบบภาษาการทำเหมืองข้อมูลแบบรวมเป็นสิ่งที่ท้าทายเพราะการทำเหมืองข้อมูลปกป้องฟังก์ชันที่หลากหลาย ตั้งแต่การกำหนดลักษณะข้อมูลไปจนถึงการวิเคราะห์วิวัฒนาการ แต่ละงานมีข้อกำหนดหลายประการ การออกแบบภาษาสำหรับคิวรี่การทำเหมืองข้อมูลที่มีประสิทธิภาพจำเป็นต้องเรียนรู้อย่างกว้างๆ เกี่ยวกับพลัง ข้อจำกัด และโครงสร้างพื้นฐานของงานการทำเหมืองข้อมูลประเภทต่างๆ