Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

กระบวนการของ KDD คืออะไร?


KDD แสดงถึงการค้นพบความรู้ในฐานข้อมูล กำหนดกระบวนการกว้างๆ ในการค้นหาความรู้ในข้อมูลและเน้นการใช้งานระดับสูงของเทคนิคการทำเหมืองข้อมูลที่แน่นอน เป็นพื้นที่ที่น่าสนใจสำหรับนักวิจัยในหลายสาขา เช่น ปัญญาประดิษฐ์ แมชชีนเลิร์นนิง การจดจำรูปแบบ ฐานข้อมูล สถิติ การได้มาซึ่งความรู้สำหรับระบบมืออาชีพ และการแสดงข้อมูลเป็นภาพ

กระบวนการค้นหาความรู้เป็นแบบวนซ้ำและโต้ตอบได้ รวมถึงเก้าขั้นตอน กระบวนการนี้จะทำซ้ำในทุกขั้นตอน ซึ่งหมายความว่าสามารถจำเป็นต้องเปลี่ยนกลับไปเป็นการกระทำก่อนหน้า กระบวนการนี้มีวิธีการจินตนาการหลายอย่างในแง่ที่ว่าเราไม่สามารถนำเสนอสูตรเดียวหรือสร้างการจัดหมวดหมู่ทางวิทยาศาสตร์ที่สมบูรณ์สำหรับการตัดสินใจที่ถูกต้องสำหรับแต่ละขั้นตอนและประเภทแอปพลิเคชัน ดังนั้นจึงจำเป็นต้องเข้าใจกระบวนการและข้อกำหนดและความเป็นไปได้ที่หลากหลายในแต่ละขั้นตอน

  • การพัฒนาความเข้าใจ − นี่คือขั้นตอนเบื้องต้นเบื้องต้น สร้างฉากสำหรับการเรียนรู้สิ่งที่ควรทำด้วยการตัดสินใจหลายอย่าง เช่น การเปลี่ยนแปลง อัลกอริธึม การเป็นตัวแทน ฯลฯ บุคคลที่รับผิดชอบโครงการ KDD จะต้องเรียนรู้และกำหนดลักษณะเป้าหมายของผู้ใช้ปลายทางและสิ่งแวดล้อมใน ซึ่งกระบวนการค้นหาความรู้จะปรากฏขึ้น (เกี่ยวข้องกับความรู้ก่อนหน้าที่เกี่ยวข้อง)

  • การสร้างชุดข้อมูลเป้าหมาย − สามารถเลือกชุดข้อมูลหรือกำหนดเป้าหมายชุดย่อยของตัวแปรหรือตัวอย่างข้อมูล ซึ่งจะทำการค้นพบ กระบวนการนี้มีความสำคัญเนื่องจาก Data Mining เรียนรู้และค้นหาจากข้อมูลที่สามารถเข้าถึงได้ นี่คือหลักฐานพื้นฐานสำหรับการสร้างแบบจำลอง หากแอตทริบิวต์ที่สำคัญขาดหายไป ณ จุดนั้น การศึกษาทั้งหมดอาจไม่ประสบความสำเร็จจากประเด็นนี้ ระบบจะพิจารณาแอตทริบิวต์เพิ่มเติม

  • การล้างข้อมูลและการประมวลผลล่วงหน้า การล้างข้อมูลกำหนดเพื่อล้างข้อมูลโดยการเติมค่าที่หายไป ทำให้ข้อมูลที่มีเสียงดังราบรื่น ระบุและขจัดค่าผิดปกติ และขจัดความไม่สอดคล้องกันในข้อมูล

  • การวิเคราะห์เชิงสำรวจและการเลือกแบบจำลองและสมมติฐาน - สามารถเลือกอัลกอริธึมการขุดข้อมูลและเลือกวิธีการที่จะใช้สำหรับการค้นหารูปแบบข้อมูล กระบวนการนี้ประกอบด้วยการตัดสินใจว่าแบบจำลองและพารามิเตอร์ใดที่เหมาะสม และจับคู่วิธีการทำเหมืองข้อมูลเฉพาะกับเกณฑ์ระยะยาวของกระบวนการ KDD

  • การขุดข้อมูล − มันถูกใช้ในการค้นหารูปแบบที่น่าสนใจในรูปแบบการแสดงแทนเฉพาะหรือชุดของการแสดงแทนดังกล่าว ที่เกี่ยวข้องกับกฎการจัดหมวดหมู่หรือต้นไม้ การถดถอย และการจัดกลุ่ม ผู้ใช้สามารถช่วยเหลือวิธีการทำเหมืองข้อมูลได้อย่างมากโดยดำเนินการตามขั้นตอนก่อนหน้าอย่างถูกต้อง

  • ดำเนินการตามความรู้ที่ค้นพบ − เป็นการใช้ความรู้โดยตรง รวมถึงความรู้ในระบบอื่นเพื่อดำเนินการเพิ่มเติม หรือเพียงแค่จัดทำเอกสารและรายงานให้ผู้มีส่วนได้เสียทราบ กระบวนการนี้ยังประกอบด้วยการตรวจสอบและแก้ไขข้อขัดแย้งที่อาจเกิดขึ้นกับความรู้ที่ยอมรับ (หรือที่ดึงมา) ก่อนหน้านี้