Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

KDD คืออะไร?


KDD แสดงถึงการค้นพบความรู้ในฐานข้อมูล กำหนดกระบวนการกว้างๆ ในการค้นหาความรู้ในข้อมูล และเน้นการใช้งานระดับสูงของเทคนิคการทำเหมืองข้อมูลที่แน่นอน เป็นพื้นที่ที่น่าสนใจสำหรับนักวิจัยในหลายสาขา เช่น ปัญญาประดิษฐ์ แมชชีนเลิร์นนิง การจดจำรูปแบบ ฐานข้อมูล สถิติ การได้มาซึ่งความรู้สำหรับระบบมืออาชีพ และการแสดงข้อมูลเป็นภาพ

วัตถุประสงค์หลักของกระบวนการ KDD คือการดึงข้อมูลจากข้อมูลในบริบทของฐานข้อมูลขนาดใหญ่ ทำได้โดยใช้อัลกอริธึม Data Mining เพื่อรับรู้สิ่งที่ถือเป็นความรู้ การค้นพบความรู้ในฐานข้อมูลถือเป็นโปรแกรม การวิเคราะห์เชิงสำรวจ และการสร้างแบบจำลองของที่เก็บข้อมูลขนาดใหญ่ KDD เป็นกระบวนการที่เป็นระเบียบในการจดจำการออกแบบที่ถูกต้อง มีประโยชน์ และเข้าใจได้จากชุดข้อมูลขนาดใหญ่และซับซ้อน

KDD เป็นขั้นตอนที่ไม่สำคัญในการระบุการออกแบบที่ถูกต้อง แปลกใหม่ อาจมีประโยชน์ และโดยทั่วไปแล้วจะมีเหตุผลในข้อมูล กระบวนการนี้บ่งชี้ว่า KDD มีขั้นตอนมากมาย ซึ่งรวมถึงการเตรียมข้อมูล การค้นหารูปแบบ การประเมินความรู้ และการปรับแต่ง ทั้งหมดทำซ้ำในการทำซ้ำหลายครั้ง โดยไม่สำคัญหมายความว่ามีการค้นหาหรือการอนุมานบางอย่าง กล่าวคือ การคำนวณปริมาณที่กำหนดไว้ล่วงหน้านั้นไม่ใช่เรื่องง่าย เช่น การคำนวณค่าเฉลี่ยของชุดตัวเลข

การทำเหมืองข้อมูลเป็นรากฐานของขั้นตอน KDD เช่น การอนุมานของอัลกอริทึมที่ตรวจสอบระเบียน พัฒนาแบบจำลอง และค้นพบรูปแบบที่ไม่รู้จักก่อนหน้านี้ แบบจำลองนี้ใช้สำหรับดึงความรู้จากข้อมูล วิเคราะห์ข้อมูล และทำนายข้อมูล

การทำเหมืองข้อมูลเป็นขั้นตอนในกระบวนการ KDD ซึ่งรวมถึงการใช้การวิเคราะห์ข้อมูลและอัลกอริธึมการค้นพบ ซึ่งภายใต้ข้อจำกัดด้านประสิทธิภาพในการคำนวณที่ยอมรับได้ จะทำการแจงนับเฉพาะรูปแบบ (หรือแบบจำลอง) เหนือข้อมูล

ฟิลด์ของรูปแบบมักจะไม่มีที่สิ้นสุด และการแจงนับของรูปแบบประกอบด้วยรูปแบบการค้นหาบางอย่างในพื้นที่นี้ ข้อจำกัดในการคำนวณเชิงปฏิบัติทำให้เกิดข้อจำกัดที่ร้ายแรงบนซับสเปซที่สามารถวิเคราะห์ได้โดยอัลกอริธึมการขุดข้อมูล

กระบวนการ KDD ประกอบด้วยการใช้ฐานข้อมูลพร้อมกับการเลือก การประมวลผลล่วงหน้า การสุ่มตัวอย่างย่อย และการแปลงข้อมูลที่จำเป็น ใช้วิธีการขุดข้อมูล (อัลกอริทึม) เพื่อระบุรูปแบบจากมัน และคำนวณผลิตภัณฑ์ของการทำเหมืองข้อมูลเพื่อรับรู้ชุดย่อยของรูปแบบที่แจกแจงแล้วถือว่าเป็นความรู้

องค์ประกอบการทำเหมืองข้อมูลของกระบวนการ KDD เกี่ยวข้องกับวิธีอัลกอริธึมโดยที่รูปแบบจะถูกแยกและแจกแจงจากบันทึก กระบวนการ KDD ที่สมบูรณ์ประกอบด้วยการประเมินและการตีความที่เป็นไปได้ของรูปแบบการขุดเพื่อตัดสินใจว่ารูปแบบใดที่สามารถจัดการกับความรู้ใหม่ได้