Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การแบ่งประเภทของข้อจำกัดในการทำเหมืองข้อมูลมีอะไรบ้าง?


อัลกอริธึมตามข้อจำกัดจำเป็นต้องมีข้อจำกัดในการลดพื้นที่การค้นหาในขั้นตอนการสร้างชุดไอเท็มบ่อยครั้ง (ขั้นตอนการสร้างกฎการเชื่อมโยงนั้นตรงกับขั้นตอนของอัลกอริธึมแบบละเอียด)

ความสำคัญของข้อจำกัดนั้นถูกกำหนดไว้อย่างดี และพวกเขาสร้างกฎการเชื่อมโยงที่น่าสนใจสำหรับลูกค้าเท่านั้น วิธีการนี้ค่อนข้างไม่สำคัญและพื้นที่กฎจะลดลงโดยที่กฎที่เหลือใช้ข้อจำกัด

ข้อจำกัดมีสามประเภทดังต่อไปนี้ −

ข้อจำกัดของอินสแตนซ์ − ข้อจำกัดของอินสแตนซ์กำหนดว่าต้องจัดกลุ่มคู่หรือชุดของอินสแตนซ์ในการวิเคราะห์คลัสเตอร์อย่างไร มีข้อจำกัดสองประเภทจากหมวดหมู่นี้ เช่น −

  • ข้อจำกัดที่ต้องเชื่อมโยง − หากมีการกำหนดข้อจำกัดที่ต้องลิงก์ในสองอ็อบเจ็กต์ x และ y ดังนั้น x และ y จะต้องถูกจัดกลุ่มเป็นคลัสเตอร์เดียวในเอาต์พุตของการวิเคราะห์คลัสเตอร์ ข้อจำกัดที่ต้องลิงก์เหล่านี้เป็นสกรรมกริยา เช่น must-link(x, y) และ must-link(y,z) จากนั้น must-link(x,z)

  • เชื่อมโยงข้อจำกัดไม่ได้ − ข้อจำกัดที่ไม่สามารถเชื่อมโยงได้เป็นการย้อนกลับของข้อจำกัดที่ต้องเชื่อมโยง หากมีการกำหนดข้อจำกัดที่ไม่สามารถเชื่อมโยงบนสองอ็อบเจ็กต์ x และ y ดังนั้นในผลลัพธ์ของการวิเคราะห์คลัสเตอร์ x และ y จะต้องเป็นของหลายคลัสเตอร์ สามารถเชื่อมโยงข้อ จำกัด ที่ไม่สามารถเชื่อมโยงได้ ถ้าไม่สามารถเชื่อมโยง (x, y) ต้องเชื่อมโยง (x, x ) และต้องลิงก์ (y, y ) จากนั้นไม่สามารถเชื่อมโยงได้ (x , คุณ )

ข้อจำกัดเกี่ยวกับคลัสเตอร์ − ข้อจำกัดในคลัสเตอร์กำหนดข้อกำหนดในคลัสเตอร์ อาจใช้แอตทริบิวต์ของคลัสเตอร์ ตัวอย่างเช่น ข้อจำกัดสามารถกำหนดจำนวนขั้นต่ำของออบเจ็กต์ในคลัสเตอร์ เส้นผ่านศูนย์กลางสูงสุดของคลัสเตอร์ หรือรูปร่างของคลัสเตอร์ (เช่น นูน) จำนวนของคลัสเตอร์ที่กำหนดไว้สำหรับวิธีการจัดกลุ่มการแบ่งพาร์ติชันสามารถทำเครื่องหมายเป็นข้อจำกัดบนคลัสเตอร์ได้

ข้อจำกัดในการวัดความคล้ายคลึงกัน − การวัดความคล้ายคลึงกัน รวมถึงระยะทางแบบยุคลิดใช้เพื่อคำนวณความคล้ายคลึงกันระหว่างวัตถุในการวิเคราะห์คลัสเตอร์ ในการใช้งานต่าง ๆ ข้อยกเว้นจะใช้ ข้อจำกัดในการวัดความคล้ายคลึงกันกำหนดข้อกำหนดที่การคำนวณความคล้ายคลึงต้องปฏิบัติตาม

ตัวอย่างเช่น มันสามารถจัดกลุ่มคนเป็นวัตถุที่เปลี่ยนในพลาซ่า ในขณะที่ระยะทางแบบยุคลิดสามารถสร้างระยะทางเดินระหว่างจุดสองจุด ข้อจำกัดในการวัดความคล้ายคลึงกันคือวิถีที่วิ่งในระยะทางที่สั้นที่สุดไม่สามารถข้ามกำแพงได้

มีอีกแนวทางหนึ่งในการจำแนกข้อจำกัดของคลัสเตอร์ โดยพิจารณาว่าต้องเคารพข้อจำกัดดังกล่าวอย่างไร ข้อจำกัดนั้นทำได้ยากหากไม่สามารถยอมรับการทำคลัสเตอร์ที่ขัดขวางข้อจำกัดนั้น ข้อจำกัดจะไม่รุนแรง หากคลัสเตอร์ที่ขัดขวางข้อจำกัดไม่เป็นที่ต้องการ แต่ยอมรับได้เมื่อไม่พบวิธีแก้ปัญหาที่ดีกว่า ข้อจำกัดที่นุ่มนวลเรียกอีกอย่างว่าการกำหนดลักษณะ