Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

CLIQUE คืออะไร?


CLIQUE เป็นอัลกอริธึมแรกที่คาดการณ์ไว้สำหรับการจัดกลุ่มย่อยของพื้นที่ย่อยที่มีขนาดเติบโตในพื้นที่ที่มีมิติสูง ในการคลัสเตอร์พื้นที่ย่อยที่มีขนาดเติบโต กระบวนการจัดกลุ่มเริ่มต้นที่พื้นที่ย่อยแบบมิติเดียวและเพิ่มขึ้นไปเป็นพื้นที่ย่อยที่มีมิติสูงกว่า

เนื่องจาก CLIQUE แบ่งแต่ละส่วนข้อมูล เช่น สถาปัตยกรรมกริด และตัดสินใจว่าเซลล์นั้นหนาแน่นโดยพิจารณาจากหลายจุดที่รวมอยู่หรือไม่ โดยอาจมองว่าเป็นการผสานรวมวิธีการจัดคลัสเตอร์แบบอิงความหนาแน่นและแบบกริด

แนวคิดของอัลกอริธึมการจัดกลุ่ม CLIQUE มีดังนี้ -

  • เมื่อพิจารณาจากจุดข้อมูลหลายมิติกลุ่มใหญ่ พื้นที่ข้อมูลโดยทั่วไปจะไม่มีส่วนร่วมอย่างสม่ำเสมอโดยจุดข้อมูล การจัดกลุ่มของ CLIQUE จะระบุพื้นที่กระจัดกระจายและ "แออัด" ในอวกาศ (หรือหน่วย) ดังนั้นจึงพบรูปแบบการกระจายที่สมบูรณ์ของชุดข้อมูล

  • หน่วยจะเป็นของแข็งหากเศษส่วนของจุดข้อมูลทั้งหมดที่รวมอยู่ในนั้นเกินกว่าพารามิเตอร์โมเดลอินพุต ใน CLIQUE คลัสเตอร์จะแสดงเป็นกลุ่มสูงสุดของหน่วยความหนาแน่นที่เชื่อมโยงกัน

CLIQUE ใช้การจัดกลุ่มแบบหลายมิติในสองกระบวนการ ซึ่งมีดังนี้ - ในกระบวนการแรก CLIQUE แบ่งพื้นที่ข้อมูล d-dimensional ออกเป็นหน่วยสี่เหลี่ยมที่ไม่ทับซ้อนกัน โดยจดจำหน่วยที่หนาแน่นระหว่างสิ่งเหล่านี้ เสร็จสมบูรณ์ (ใน 1-D) สำหรับแต่ละมิติ

การระบุพื้นที่ค้นหาของนักเรียนขึ้นอยู่กับคุณสมบัติของ Apriori ที่ใช้ในการขุดกฎสมาคม โดยทั่วไปแล้ว ทรัพย์สินจะใช้ความรู้เดิมของสิ่งของในพื้นที่ค้นหาเพื่อให้สามารถตัดบางส่วนของพื้นที่ได้

คุณสมบัติของ CLIQUE มีดังต่อไปนี้:หากหน่วย k-dimensional หนาแน่น การฉายภาพใน (k-1) - มิติก็เช่นกัน นั่นคือ เมื่อให้หน่วยความหนาแน่นของนักเรียนมิติ k แล้ว ถ้ามันสามารถตรวจสอบหน่วยการฉายภาพ (k-1) ของมันและพบว่ามีหน่วยที่ไม่หนาแน่น ก็จะสามารถเข้าใจได้ว่าหน่วยมิติที่ k ก็ไม่สามารถหนาแน่นได้เช่นกัน

ดังนั้นจึงสามารถสร้างหน่วยที่มีศักยภาพหรือหน่วยนักเรียนหนาแน่นในพื้นที่ k- มิติจากหน่วยหนาแน่นที่พบในพื้นที่มิติ (k -1) โดยทั่วไป พื้นที่ผลลัพธ์ที่ค้นหามีขนาดเล็กกว่าพื้นที่เดิมมาก มีการตรวจสอบหน่วยหนาแน่นเพื่อตัดสินกลุ่ม

ในกระบวนการที่สอง CLIQUE จะสร้างคำอธิบายขั้นต่ำสำหรับแต่ละคลัสเตอร์ดังนี้ สำหรับแต่ละคลัสเตอร์ จะกำหนดพื้นที่สูงสุดที่ครอบคลุมคลัสเตอร์ของหน่วยหนาแน่นที่เชื่อมโยง มันตัดสินใจครอบคลุมน้อยที่สุด (คำอธิบายตรรกะ) สำหรับแต่ละคลัสเตอร์

CLIQUE จำเป็นต้องค้นพบสเปซย่อยของไดเมนชันที่ใหญ่ที่สุดรวมถึงคลัสเตอร์ที่มีความหนาแน่นสูงอยู่ในสเปซย่อยเหล่านั้น ไม่ไวต่อชุดของออบเจ็กต์อินพุตและไม่แสร้งทำเป็นว่ามีการกระจายข้อมูลตามรูปแบบบัญญัติ โดยจะปรับขนาดเชิงเส้นตามขนาดของอินพุตและมีความสามารถในการปรับขนาดได้ดีที่สุดเนื่องจากมีการปรับปรุงมิติข้อมูลหลายรายการในข้อมูล