การทำเหมืองข้อมูลเป็นขั้นตอนในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการแบ่งปันผ่านข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้วยวิธีใหม่ที่มีทั้งเหตุผลและเป็นประโยชน์ต่อเจ้าของข้อมูล
เป็นขั้นตอนของการคัดเลือก สำรวจ และจำลองข้อมูลปริมาณมากเพื่อค้นหาความสม่ำเสมอหรือความสัมพันธ์ที่ไม่เคยทราบมาก่อนเพื่อให้ได้ผลลัพธ์ที่ชัดเจนและเป็นประโยชน์สำหรับเจ้าของฐานข้อมูล
ไม่จำกัดเฉพาะการใช้อัลกอริธึมคอมพิวเตอร์หรือเทคนิคทางสถิติ เป็นกระบวนการของ Business Intelligence ที่สามารถใช้ร่วมกับเทคโนโลยีสารสนเทศเพื่อสนับสนุนการตัดสินใจของบริษัทได้
การทำเหมืองข้อมูลคล้ายกับวิทยาศาสตร์ข้อมูล ดำเนินการโดยบุคคลในสถานการณ์เฉพาะในชุดข้อมูลเฉพาะโดยมีวัตถุประสงค์ เฟสนี้ประกอบด้วยบริการหลายประเภท เช่น การทำเหมืองข้อความ การทำเหมืองเว็บ การทำเหมืองเสียงและวิดีโอ การทำเหมืองข้อมูลด้วยภาพ และการทำเหมืองโซเชียลมีเดีย เสร็จสมบูรณ์ผ่านซอฟต์แวร์ที่เรียบง่ายหรือเฉพาะเจาะจงอย่างมาก
การทำเหมืองข้อมูลได้รับความสนใจอย่างมากในตลาดข้อมูลและสังคมโดยรวมในช่วงหลายปีที่ผ่านมา เนื่องจากการมีอยู่ของข้อมูลจำนวนมหาศาลและความจำเป็นในการเปลี่ยนข้อมูลดังกล่าวให้เป็นข้อมูลและความรู้ที่เป็นประโยชน์ ข้อมูลและความรู้ที่ได้รับสามารถใช้เป็นซอฟต์แวร์ได้ตั้งแต่การวิเคราะห์อุตสาหกรรม การตรวจจับการฉ้อโกง การรักษาผู้ใช้ ไปจนถึงการควบคุมการผลิตและการสำรวจทางวิทยาศาสตร์
การทำเหมืองข้อมูลถือได้ว่าเป็นผลจากความก้าวหน้าตามธรรมชาติของเทคโนโลยีข้อมูล ตลาดระบบฐานข้อมูลสนับสนุนทิศทางวิวัฒนาการในการพัฒนาฟังก์ชันต่างๆ ดังต่อไปนี้ รวมถึงการรวบรวมข้อมูลและการสร้างฐานข้อมูล การจัดการข้อมูล และการวิเคราะห์ข้อมูลขั้นสูง
ตัวอย่างเช่น การพัฒนาล่าสุดของการเก็บรวบรวมข้อมูลและโครงสร้างการสร้างฐานข้อมูลนั้นมีความจำเป็นสำหรับการพัฒนาในภายหลังของโครงสร้างที่มีประสิทธิภาพสำหรับการจัดเก็บข้อมูลและการเรียกค้นข้อมูล และการประมวลผลการสืบค้นและธุรกรรม ด้วยระบบฐานข้อมูลที่หลากหลายซึ่งให้การประมวลผลการสืบค้นและธุรกรรมเป็นแนวทางปฏิบัติทั่วไป การวิเคราะห์ข้อมูลขั้นสูงจึงได้พัฒนาเป็นออบเจกต์ถัดไป
ข้อมูลสามารถบันทึกในฐานข้อมูลและที่เก็บข้อมูลหลายประเภท โครงสร้างที่เก็บข้อมูลหนึ่งโครงสร้างที่ปรากฏในคลังข้อมูล ซึ่งเป็นที่เก็บของแหล่งข้อมูลที่แตกต่างกันหลายแห่งที่จัดอยู่ภายใต้สคีมาแบบรวมที่ไซต์แต่ละแห่งเพื่อสนับสนุนการตัดสินใจของฝ่ายบริหาร
เทคโนโลยีคลังข้อมูลเกี่ยวข้องกับการล้างข้อมูล การรวมข้อมูล และการประมวลผลการวิเคราะห์ออนไลน์ (OLAP) โดยเฉพาะเทคนิคการวิเคราะห์ที่มีฟังก์ชันต่างๆ รวมถึงการสรุป การรวม และการรวม และความสามารถในการดูข้อมูลจากหลายมุม