Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

องค์ประกอบในการจัดกลุ่มแบบลำดับชั้นคืออะไร


วิธีการจัดกลุ่มแบบลำดับชั้นดำเนินการโดยการรวมออบเจ็กต์ข้อมูลเข้ากับแผนผังของคลัสเตอร์ อัลกอริทึมการจัดกลุ่มแบบลำดับชั้นเป็นแบบบนลงล่างหรือล่างขึ้นบน คุณสมบัติของเทคนิคการจัดกลุ่มตามลำดับชั้นที่แม่นยำนั้นเสื่อมถอยจากการขาดในการปรับปรุง เนื่องจากการตัดสินใจรวมหรือแยกเสร็จสมบูรณ์

มีองค์ประกอบต่าง ๆ ของการจัดกลุ่มตามลำดับชั้นซึ่งมีดังต่อไปนี้ -

ขาดฟังก์ชันวัตถุประสงค์สากล

วิธีการจัดกลุ่มแบบลำดับชั้นแบบรวมกลุ่มใช้องค์ประกอบหลายอย่างในการตัดสินใจแบบโลคัล ในแต่ละขั้นตอน ซึ่งคลัสเตอร์จะต้องถูกรวมเข้าด้วยกัน (หรือแยกสำหรับแนวทางที่แตกแยก)

วิธีนี้ทำให้ได้อัลกอริธึมการจัดกลุ่มที่ป้องกันไม่ให้เกิดปัญหาในการแก้ปัญหาการเพิ่มประสิทธิภาพแบบผสมผสานที่ซับซ้อน

ความสามารถในการจัดการขนาดคลัสเตอร์ต่างๆ

องค์ประกอบของการจัดกลุ่มแบบลำดับชั้นแบบ agglomerative ที่จะพิจารณาขนาดที่เชื่อมโยงกันของกลุ่มคลัสเตอร์ที่รวมกัน ใช้เฉพาะกับโครงร่างความใกล้เคียงของคลัสเตอร์ที่มีผลรวม เช่น centroid, Ward's และค่าเฉลี่ยของกลุ่ม

มีสองวิธี เช่น การถ่วงน้ำหนัก ซึ่งพิจารณาคลัสเตอร์ทั้งหมดอย่างเท่าเทียมกัน และไม่ถ่วงน้ำหนัก ซึ่งจะสร้างจำนวนจุดในแต่ละคลัสเตอร์ ศัพท์เฉพาะของการถ่วงน้ำหนักหรือไม่ถ่วงน้ำหนักจะกำหนดจุดข้อมูล ไม่ใช่คลัสเตอร์ กล่าวอีกนัยหนึ่ง การพิจารณาคลัสเตอร์ที่มีขนาดไม่เท่ากันจะให้น้ำหนักหลายจุดในคลัสเตอร์ต่างๆ ในขณะที่การสร้างขนาดคลัสเตอร์ในบัญชีจะให้คะแนนในคลัสเตอร์ต่างๆ ที่มีน้ำหนักใกล้เคียงกัน

การตัดสินใจในการควบรวมกิจการถือเป็นที่สิ้นสุด

อัลกอริธึมการจัดกลุ่มแบบลำดับชั้นแบบรวมกลุ่มมีอิทธิพลต่อการสร้างการตัดสินใจในท้องถิ่นที่ดีเกี่ยวกับการรวมสองคลัสเตอร์ เนื่องจากพวกเขาต้องการข้อมูลเกี่ยวกับความคล้ายคลึงแบบคู่ของจุดทั้งหมด เนื่องจากมีการตัดสินใจรวมสองคลัสเตอร์ จึงไม่สามารถยกเลิกได้ในครั้งต่อไป วิธีนี้ช่วยหลีกเลี่ยงองค์ประกอบการปรับให้เหมาะสมในพื้นที่ไม่ให้กลายเป็นเกณฑ์การเพิ่มประสิทธิภาพส่วนกลาง

ตัวอย่างเช่น แม้ว่าเกณฑ์ "ลดข้อผิดพลาดกำลังสองให้น้อยที่สุด" จากค่าเฉลี่ย K จะใช้ในการพิจารณาว่าคลัสเตอร์ใดที่จะรวมในวิธีการของ Ward แต่คลัสเตอร์ในแต่ละระดับไม่ได้กำหนดขั้นต่ำในพื้นที่ที่เกี่ยวข้องกับ SSE ทั้งหมด แท้จริงแล้ว คลัสเตอร์ไม่ใช่ไดนามิก ในแง่ที่ว่าจุดในคลัสเตอร์หนึ่งอาจอยู่ใกล้กับเซนทรอยด์ของคลัสเตอร์อื่นมากกว่าจุดศูนย์กลางของคลัสเตอร์ล่าสุด

วิธีการบางอย่างที่พยายามเอาชนะข้อจำกัดที่รวมเข้าด้วยกันถือเป็นที่สิ้นสุด วิธีหนึ่งพยายามสร้างคลัสเตอร์แบบลำดับชั้นโดยการปรับเปลี่ยนกิ่งก้านของต้นไม้รอบๆ เพื่อเพิ่มฟังก์ชันวัตถุประสงค์ทั่วโลก อีกวิธีหนึ่งต้องใช้เทคนิคการแบ่งกลุ่มแบบแบ่งพาร์ติชัน ซึ่งรวมถึง Kmeans เพื่อสร้างคลัสเตอร์ขนาดเล็กบางกลุ่ม จากนั้นจึงใช้การจัดกลุ่มแบบลำดับชั้นโดยใช้คลัสเตอร์ขนาดเล็กเหล่านี้เป็นจุดเริ่มต้น