Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การทำคลัสเตอร์ตามต้นแบบคืออะไร


ในการทำคลัสเตอร์แบบอิงต้นแบบ คลัสเตอร์คือกลุ่มของออบเจ็กต์ที่บางอ็อบเจ็กต์อยู่ใกล้กับต้นแบบที่แสดงถึงคลัสเตอร์มากกว่าต้นแบบของคลัสเตอร์อื่นๆ อัลกอริทึมการจัดกลุ่มตามต้นแบบอย่างง่ายที่ต้องการเซนทรอยด์ขององค์ประกอบในคลัสเตอร์เป็นต้นแบบของคลัสเตอร์

มีหลายวิธีในการจัดกลุ่มตามต้นแบบซึ่งมีดังต่อไปนี้ -

  • เปิดใช้งานอ็อบเจ็กต์ให้อยู่ในคลัสเตอร์ที่สูงกว่าหนึ่งคลัสเตอร์ นอกจากนี้ วัตถุยังเป็นของแต่ละคลัสเตอร์ที่มีน้ำหนักบางส่วน วิธีการดังกล่าวกล่าวถึงข้อเท็จจริงที่ว่าวัตถุบางอย่างใกล้เคียงกับต้นแบบคลัสเตอร์หลายตัวในทำนองเดียวกัน

  • คลัสเตอร์ถูกสร้างแบบจำลองเป็นการแจกแจงทางสถิติ กล่าวคือ ออบเจ็กต์ถูกสร้างขึ้นโดยเฟสสุ่มจากการแจกแจงทางสถิติที่มีคุณสมบัติตามพารามิเตอร์ทางสถิติหลายตัว รวมถึงค่าเฉลี่ยและความแปรปรวน มุมมองนี้จะสรุปแนวคิดของต้นแบบและช่วยให้จำเป็นต้องมีวิธีการทางสถิติที่เป็นที่ยอมรับ

  • คลัสเตอร์ถูกจำกัดให้มีการเชื่อมโยงที่คงที่ ความสัมพันธ์เหล่านี้เป็นข้อจำกัดที่กำหนดความสัมพันธ์ในละแวกใกล้เคียง เช่น ระดับที่กลุ่มสองกลุ่มเป็นเพื่อนบ้านกัน การจำกัดความสัมพันธ์ระหว่างคลัสเตอร์สามารถกำหนดการดำเนินการและการแสดงข้อมูลเป็นภาพได้

Fuzzy c-mean ใช้แนวคิดจากพื้นที่ของ Fuzzy Logic และ Fuzzy Set Theory เพื่อเสนอการออกแบบการจัดกลุ่ม ซึ่งเหมือนกับ K-mean แต่ไม่จำเป็นต้องกำหนดจุดหนักๆ ให้กับคลัสเตอร์เดียว

การทำคลัสเตอร์โมเดลแบบผสมใช้วิธีการที่กลุ่มของคลัสเตอร์สามารถสร้างโมเดลเป็นการผสมผสานของการแจกแจงได้ แบบหนึ่งสำหรับแต่ละคลัสเตอร์ รูปแบบการจัดกลุ่มขึ้นอยู่กับ Self-Organizing Maps (SOM) ที่ใช้การจัดกลุ่มภายในโครงสร้างที่ต้องการคลัสเตอร์ให้มีการเชื่อมโยงที่กำหนดไว้ล่วงหน้าซึ่งกันและกันรวมถึงโครงสร้างกริดแบบสองมิติ

การจัดกลุ่มคลุมเครือ − หากอ็อบเจ็กต์ข้อมูลถูกแจกจ่ายในชุดที่ไม่เกี่ยวข้องกัน คำอธิบายที่ชัดเจนของอ็อบเจ็กต์ไปยังคลัสเตอร์ที่ไม่ปะติดปะต่อกันดูเหมือนจะเป็นวิธีการที่เหมาะสมที่สุด แต่ในบางกรณี ออบเจ็กต์ในชุดข้อมูลไม่สามารถแบ่งออกเป็นคลัสเตอร์ที่มีความเป็นอิสระได้ และจะมีความเป็นเอกเทศเฉพาะในการกำหนดออบเจ็กต์ให้กับคลัสเตอร์เฉพาะ

พิจารณาวัตถุที่อยู่ใกล้ขอบเขตของกระจุกสองกระจุก แต่อยู่ใกล้กับหนึ่งในกระจุกมากกว่า ในบางกรณี การกำหนดน้ำหนักให้กับทุกอ็อบเจ็กต์และแต่ละคลัสเตอร์อาจมีความเหมาะสมมากกว่าที่จะกำหนดน้ำหนักให้กับทุกอ็อบเจกต์และแต่ละคลัสเตอร์ที่แสดงระดับที่ออบเจกต์อยู่ข้างหน้าคลัสเตอร์

วิธีความน่าจะเป็นยังสามารถรองรับน้ำหนักดังกล่าวได้ แม้ว่าวิธีความน่าจะเป็นจะเป็นประโยชน์ในหลาย ๆ สถานการณ์ แต่ก็มีบางครั้งที่การตัดสินใจแบบจำลองทางสถิติที่เหมาะสมอาจเป็นเรื่องยาก โดยทั่วไปแล้ว ต้องใช้วิธีการจัดกลุ่มแบบไม่มีความเป็นไปได้เพื่อให้มีความสามารถเหมือนกัน