การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้วยวิธีใหม่ที่มีทั้งเหตุผลและเป็นประโยชน์ต่อเจ้าของข้อมูล
การทำเหมืองข้อมูลเป็นสาขาสหวิทยาการ ซึ่งเป็นการรวมกลุ่มของสาขาวิชาต่างๆ เช่น ระบบฐานข้อมูล สถิติ การเรียนรู้ของเครื่อง การแสดงภาพ และวิทยาศาสตร์ข้อมูล ทั้งนี้ขึ้นอยู่กับวิธีการขุดข้อมูลที่ใช้ เทคนิคจากสาขาวิชาอื่นอาจนำไปใช้ เช่น โครงข่ายประสาทเทียม ทฤษฎีเซตคลุมเครือและ/หรือคร่าวๆ การแสดงความรู้ การเขียนโปรแกรมลอจิกอุปนัย หรือการคำนวณประสิทธิภาพสูง
การทำเหมืองข้อมูลคล้ายกับวิทยาศาสตร์ข้อมูล ดำเนินการโดยบุคคลในสถานการณ์เฉพาะในชุดข้อมูลเฉพาะโดยมีวัตถุประสงค์ เฟสนี้ประกอบด้วยบริการหลายประเภท เช่น การทำเหมืองข้อความ การทำเหมืองเว็บ การทำเหมืองเสียงและวิดีโอ การทำเหมืองข้อมูลด้วยภาพ และการทำเหมืองโซเชียลมีเดีย เสร็จสมบูรณ์ผ่านซอฟต์แวร์ที่เรียบง่ายหรือเฉพาะเจาะจงอย่างมาก
การทำเหมืองข้อมูลโดยเอาต์ซอร์ซ ทำให้งานทั้งหมดสามารถทำได้เร็วขึ้นด้วยต้นทุนการดำเนินงานที่ต่ำ บริษัทเฉพาะยังสามารถใช้เทคโนโลยีใหม่ในการบันทึกข้อมูลที่ไม่สามารถค้นหาด้วยตนเองได้ มีข้อมูลมากมายบนหลายแพลตฟอร์ม แต่เข้าถึงความรู้ที่จำกัดได้มาก
ความท้าทายที่สำคัญคือการวิเคราะห์ข้อมูลเพื่อดึงข้อมูลสำคัญที่สามารถใช้ในการแก้ปัญหาหรือเพื่อการพัฒนาบริษัท มีเครื่องมือและเทคนิคแบบไดนามิกมากมายในการขุดข้อมูลและค้นพบวิจารณญาณที่ดีขึ้นจากข้อมูลนี้
ข้อจำกัดของการทำเหมืองข้อมูลส่วนใหญ่เกี่ยวข้องกับข้อมูลหรือบุคลากร มากกว่าที่เกี่ยวกับเทคโนโลยี
-
ซอฟต์แวร์การทำเหมืองข้อมูลเป็นเครื่องมือที่ทรงพลังมาก แต่ก็ไม่ใช่แอปพลิเคชันแบบพอเพียง สามารถประสบความสำเร็จได้ และต้องใช้ผู้เชี่ยวชาญทางเทคนิคและการวิเคราะห์ที่มีทักษะซึ่งสามารถจัดโครงสร้างการวิเคราะห์และตีความผลลัพธ์ที่สร้างขึ้นได้
-
การทำเหมืองข้อมูลใช้เพื่อให้ได้รูปแบบและความสัมพันธ์ โดยไม่ได้บอกคุณค่าหรือความสำคัญของรูปแบบเหล่านี้แก่ผู้ใช้ ผู้ใช้จะต้องเป็นผู้กำหนดประเภทเหล่านี้
-
ความถูกต้องของรูปแบบที่ค้นพบนั้นขึ้นอยู่กับว่าสิ่งเหล่านี้ถูกเปรียบเทียบกับสถานการณ์จริงอย่างไร ตัวอย่างเช่น สามารถประเมินความถูกต้องของแอปพลิเคชันการทำเหมืองข้อมูลที่ออกแบบมาเพื่อระบุผู้ต้องสงสัยที่อาจเป็นผู้ต้องสงสัยในกลุ่มบุคคลจำนวนมาก ผู้ใช้สามารถทดสอบแบบจำลองโดยใช้ข้อมูลที่มีข้อมูลเกี่ยวกับผู้ก่อการร้ายที่รู้จัก
-
การทำเหมืองข้อมูลสามารถระบุความเชื่อมโยงระหว่างพฤติกรรมและตัวแปร โดยไม่จำเป็นต้องระบุความสัมพันธ์เชิงสาเหตุ ตัวอย่างเช่น แอปพลิเคชันสามารถระบุได้ว่ารูปแบบพฤติกรรม เช่น แนวโน้มที่จะซื้อตั๋วเครื่องบินก่อนกำหนดออกเดินทางไม่นานนั้นเกี่ยวข้องกับลักษณะเฉพาะ เช่น รายได้ ระดับการศึกษา และการใช้อินเทอร์เน็ต