การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่มีความหมายโดยกลั่นกรองข้อมูลจำนวนมากที่จัดเก็บไว้ในที่เก็บข้อมูล โดยใช้เทคโนโลยีการจดจำรูปแบบ ตลอดจนเทคนิคทางสถิติและคณิตศาสตร์
เป็นการวิเคราะห์ชุดข้อมูลเชิงสังเกตเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกในเทคนิคใหม่ที่มีทั้งที่เข้าใจและเป็นประโยชน์ต่อเจ้าของข้อมูล การทำเหมืองข้อมูลมีแอปพลิเคชันต่างๆ ดังนี้ -
คลังข้อมูลและการประมวลผลข้อมูลล่วงหน้า − คลังข้อมูลมีความจำเป็นสำหรับการแลกเปลี่ยนข้อมูลและการทำเหมืองข้อมูล ในพื้นที่ของข้อมูลเชิงพื้นที่ แต่ไม่มีคลังข้อมูลเชิงพื้นที่ที่แท้จริงในขณะนี้
การสร้างโกดังดังกล่าวได้ต้องค้นหาวิธีการในการแก้ไขความไม่เข้ากันของข้อมูลทางภูมิศาสตร์และชั่วคราว เช่น การกระทบยอดความหมาย ระบบอ้างอิง เรขาคณิต ความแม่นยำ และความแม่นยำ
สำหรับซอฟต์แวร์ทางคณิตศาสตร์โดยทั่วไป วิธีการที่จำเป็นสำหรับการรวมข้อมูลจากแหล่งที่แตกต่างกัน (รวมถึงข้อมูลที่ครอบคลุมช่วงเวลาที่แตกต่างกัน) และสำหรับการระบุกิจกรรม ตัวอย่างเช่น สำหรับข้อมูลสภาพอากาศและระบบนิเวศ (ซึ่งเป็นเชิงพื้นที่และเวลา) ปัญหาคือมีเหตุการณ์มากเกินไปในโดเมนเชิงพื้นที่และมีน้อยเกินไปในโดเมนชั่วคราว
การขุดประเภทข้อมูลที่ซับซ้อน − ชุดข้อมูลทางวิทยาศาสตร์มีลักษณะต่างกัน โดยทั่วไปประกอบด้วยข้อมูลกึ่งโครงสร้างและไม่มีโครงสร้าง รวมถึงข้อมูลมัลติมีเดียและข้อมูลสตรีมที่อ้างอิงทางภูมิศาสตร์ วิธีการที่มีประสิทธิภาพเป็นสิ่งจำเป็นสำหรับการจัดการข้อมูลเชิงพื้นที่ ลำดับชั้นของแนวคิดที่เกี่ยวข้อง และความสัมพันธ์ทางภูมิศาสตร์ที่ซับซ้อน (เช่น ระยะทางที่ไม่ใช่ยุคลิเดียน)
การขุดตามกราฟ − มักจะเป็นเรื่องยากหรือเป็นไปไม่ได้ที่จะจำลองปรากฏการณ์และกระบวนการทางกายภาพหลายอย่าง เนื่องจากข้อจำกัดของแนวทางการสร้างแบบจำลองที่มีอยู่ อีกวิธีหนึ่งคือ กราฟที่มีป้ายกำกับสามารถใช้เพื่อพิชิตคุณลักษณะเชิงพื้นที่ ทอพอโลยี เรขาคณิต และเชิงสัมพันธ์อื่นๆ ที่มีอยู่ในชุดข้อมูลตัวเลขได้
ในการสร้างแบบจำลองกราฟ ทุกข้อมูลที่จะขุดจะถูกอธิบายโดยจุดยอดในกราฟ และขอบระหว่างจุดยอดจะอธิบายความสัมพันธ์ระหว่างวัตถุ ตัวอย่างเช่น กราฟสามารถใช้เพื่อสร้างแบบจำลองโครงสร้างทางเคมีและข้อมูลที่สร้างขึ้นโดยการจำลองเชิงตัวเลข เช่น การจำลองการไหลของของไหล
ความสำเร็จของการสร้างแบบจำลองกราฟขึ้นอยู่กับการปรับปรุงความสามารถในการปรับขนาดและประสิทธิภาพของงานการทำเหมืองข้อมูลแบบคลาสสิกหลายๆ งาน เช่น การจัดประเภท การทำเหมืองข้อมูลรูปแบบบ่อยครั้ง และการจัดกลุ่ม
เครื่องมือสร้างภาพและความรู้เฉพาะโดเมน − อินเทอร์เฟซผู้ใช้แบบกราฟิกระดับสูงและเครื่องมือสร้างภาพเป็นสิ่งจำเป็นสำหรับระบบการทำเหมืองข้อมูลเชิงตัวเลข สิ่งเหล่านี้จะต้องรวมกับระบบข้อมูลเฉพาะโดเมนและระบบฐานข้อมูลที่มีอยู่เพื่อเป็นแนวทางให้นักวิจัยและผู้ใช้ทั่วไปในการค้นหาการออกแบบ ตีความและแสดงภาพการออกแบบที่ค้นพบ และใช้ความรู้ที่ค้นพบในการตัดสินใจ