Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การขุดสมาคมตามข้อจำกัดคืออะไร?


ขั้นตอนการทำเหมืองข้อมูลสามารถเปิดเผยกฎหลายพันข้อจากชุดข้อมูลที่กำหนด ซึ่งส่วนใหญ่จบลงด้วยความเป็นอิสระหรือสร้างความยุ่งยากให้กับผู้ใช้ ผู้ใช้จะเข้าใจได้ดีที่สุดว่า "ทิศทาง" ของการขุดสามารถนำไปสู่รูปแบบที่น่าสนใจและ "รูปแบบ" ของรูปแบบหรือกฎเกณฑ์ที่พวกเขาต้องการค้นพบได้

ดังนั้น ฮิวริสติกที่ดีคือการให้ผู้ใช้กำหนดสัญชาตญาณหรือความคาดหวังดังกล่าว เป็นข้อจำกัดในการจำกัดพื้นที่การค้นหา กลยุทธ์นี้เรียกว่าการขุดตามข้อจำกัด

อัลกอริธึมตามข้อจำกัดจำเป็นต้องมีข้อจำกัดในการลดพื้นที่การค้นหาในขั้นตอนการสร้างชุดไอเท็มบ่อยครั้ง (ขั้นตอนการสร้างกฎการเชื่อมโยงนั้นตรงกับขั้นตอนของอัลกอริธึมที่ละเอียดถี่ถ้วน)

ข้อจำกัดทั่วไปคือขีดจำกัดขั้นต่ำของการสนับสนุน หากไม่มีการควบคุมข้อจำกัด การรวมอยู่ในขั้นตอนการขุดสามารถสนับสนุนการลดพื้นที่สำรวจได้อย่างมาก เนื่องจากคำจำกัดความของขอบเขตภายในตาข่ายของพื้นที่ค้นหา ตามด้วยการสำรวจที่ไม่จำเป็น

ข้อจำกัดที่สำคัญมีการกำหนดไว้อย่างดี - สร้างเฉพาะกฎการเชื่อมโยงที่ดึงดูดผู้ใช้ วิธีการนี้ค่อนข้างไม่สำคัญและพื้นที่กฎจะลดลงโดยที่วิธีที่เหลือจะเป็นไปตามข้อจำกัด

การทำคลัสเตอร์ตามข้อจำกัดจะค้นหาคลัสเตอร์ที่ตรงตามการตั้งค่าหรือข้อจำกัดที่ผู้ใช้กำหนด ขึ้นอยู่กับลักษณะของข้อจำกัด การจัดกลุ่มตามข้อจำกัดสามารถนำมาใช้มากกว่าวิธีการที่แตกต่างกัน

ข้อจำกัดสามารถรวมถึงสิ่งต่อไปนี้ซึ่งมีดังต่อไปนี้ −

ข้อจำกัดประเภทความรู้ − สิ่งเหล่านี้กำหนดประเภทของความรู้ที่จะขุด รวมถึงการเชื่อมโยงหรือความสัมพันธ์

ข้อจำกัดของข้อมูล − สิ่งเหล่านี้กำหนดชุดของข้อมูลที่เกี่ยวข้องกับงาน เช่น ข้อจำกัดของมิติ/ระดับ − สิ่งเหล่านี้กำหนดมิติที่ต้องการ (หรือแอตทริบิวต์) ของข้อมูลที่ต้องการ หรือวิธีการของลำดับชั้นของแนวคิด เพื่อใช้ในการขุด

ข้อจำกัดที่น่าสนใจ − สิ่งเหล่านี้กำหนดเกณฑ์ในการวัดตัวเลขของความน่าสนใจของกฎ รวมถึงการสนับสนุน ความมั่นใจ และความสัมพันธ์

ข้อจำกัดของกฎ − สิ่งเหล่านี้กำหนดรูปแบบของกฎที่จะขุด ข้อจำกัดดังกล่าวสามารถกำหนดเป็น metarules (เทมเพลตกฎ) เป็นจำนวนสูงสุดหรือต่ำสุดของเพรดิเคตที่สามารถปรากฏในกฎก่อนหน้าหรือที่ตามมา หรือเป็นความสัมพันธ์ระหว่างแอตทริบิวต์ ค่าแอตทริบิวต์ และ/หรือผลรวม

ข้อจำกัดต่อไปนี้สามารถอธิบายได้โดยใช้ภาษาคิวรีการทำเหมืองข้อมูลแบบประกาศระดับสูงและอินเทอร์เฟซผู้ใช้ การขุดแบบอิงตามข้อจำกัดรูปแบบนี้ทำให้ผู้ใช้สามารถกำหนดกฎเกณฑ์ที่ต้องการเปิดเผยได้ ดังนั้นด้วยการสร้างกระบวนการขุดข้อมูลให้มีประสิทธิภาพมากขึ้น

นอกจากนี้ เครื่องมือเพิ่มประสิทธิภาพการสืบค้นข้อมูลการทำเหมืองที่ซับซ้อนยังสามารถใช้เพื่อแก้ไขข้อจำกัดที่กำหนดโดยผู้ใช้ ซึ่งจะทำให้กระบวนการทำเหมืองมีประสิทธิภาพมากขึ้น การขุดตามข้อจำกัดช่วยเพิ่มการขุดและการวิเคราะห์เชิงสำรวจเชิงโต้ตอบ