Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

อัลกอริทึมของการทำคลัสเตอร์ตามตารางคืออะไร


กริดคือวิธีที่มีประสิทธิภาพในการจัดระเบียบชุดข้อมูล โดยมีขนาดเล็กที่สุด แนวคิดคือการแบ่งค่าที่ใช้ได้ของแต่ละแอตทริบิวต์ออกเป็นช่วงต่อเนื่องกันหลายช่วง ทำให้เกิดชุดของเซลล์กริด แต่ละอ็อบเจ็กต์จะลดลงในเซลล์กริดซึ่งมีช่วงแอตทริบิวต์ที่เท่ากันซึ่งรวมค่าของออบเจกต์ด้วย

สามารถสร้างออบเจ็กต์ลงในเซลล์กริดได้ในครั้งเดียวผ่านระเบียน และสามารถรวบรวมข้อมูลเกี่ยวกับแต่ละเซลล์ รวมทั้งจำนวนจุดในเซลล์ได้พร้อมกัน

มีหลายวิธีในการใช้การจัดกลุ่มโดยใช้กริด แต่วิธีการส่วนใหญ่จะยึดตามความหนาแน่น อัลกอริทึมของการจัดกลุ่มตามตารางมีดังนี้ -

  • แสดงถึงชุดของเซลล์กริด

  • สร้างวัตถุไปยังเซลล์ที่เหมาะสมและคำนวณความหนาแน่นของแต่ละเซลล์

  • ขจัดเซลล์ที่มีความหนาแน่นต่ำกว่าเกณฑ์ที่กำหนดไว้ r.

  • สร้างกระจุกจากชุดเซลล์หนาแน่นที่อยู่ติดกัน

การกำหนดเซลล์กริด − นี่เป็นขั้นตอนพื้นฐานในกระบวนการ แต่ยังมีความชัดเจนน้อยที่สุด เนื่องจากมีหลายวิธีในการแบ่งค่าที่เป็นไปได้ของแต่ละแอตทริบิวต์ออกเป็นช่วงต่อเนื่องกันหลายช่วง สำหรับแอตทริบิวต์ที่ต่อเนื่องกัน วิธีหนึ่งคือการแบ่งค่าออกเป็นช่วงความกว้างเดียวกัน หากใช้วิธีนี้กับแต่ละแอตทริบิวต์ ดังนั้นเซลล์กริดที่เป็นผลลัพธ์ทั้งหมดจึงมีปริมาตรใกล้เคียงกัน และความหนาแน่นของเซลล์จะถูกกำหนดอย่างง่ายดายเป็นจุดหลายจุดในเซลล์

ความหนาแน่นของเซลล์กริด − มันสามารถกำหนดความหนาแน่นของเซลล์กริดเป็นหลายจุดหารด้วยปริมาตรของภูมิภาค ในอีกแง่หนึ่ง ความหนาแน่นคือจำนวนจุดต่อจำนวนพื้นที่ โดยไม่คำนึงถึงมิติของพื้นที่นั้น

การสร้างคลัสเตอร์จากเซลล์กริดหนาแน่น − การสร้างคลัสเตอร์จากชุดเซลล์หนาแน่นที่อยู่ติดกันนั้นค่อนข้างง่าย มีปัญหาบางอย่างเช่นจำเป็นต้องกำหนดสิ่งที่สามารถกำหนดโดยเซลล์ที่อยู่ติดกัน วิธีการจัดกลุ่มมีข้อเสียบางประการที่สามารถแก้ไขได้โดยการสร้างอัลกอริทึมที่ละเอียดขึ้นเล็กน้อย ตัวอย่างเช่น มีความเป็นไปได้ที่จะเป็นเซลล์ว่างบางส่วนบนขอบเขตของคลัสเตอร์

ใช้ได้กับการปรับปรุงการจัดกลุ่มตามตารางพื้นฐานโดยใช้ข้อมูลที่สูงกว่าความหนาแน่น ในบางกรณี บันทึกมีทั้งแอตทริบิวต์เชิงพื้นที่และไม่ใช่เชิงพื้นที่ ในอีกแง่หนึ่ง มีแอตทริบิวต์ต่างๆ ที่กำหนดพื้นที่ของออบเจ็กต์ในเวลาหรือพื้นที่ ในขณะที่แอตทริบิวต์ต่างๆ จะกำหนดองค์ประกอบอื่นๆ ของออบเจ็กต์

ตัวอย่างคือบ้านซึ่งมีทั้งพื้นที่และหลายลักษณะ รวมทั้งราคาหรือพื้นที่เป็นตารางฟุต เนื่องจากความสัมพันธ์อัตโนมัติเชิงพื้นที่ (หรือชั่วคราว) ออบเจ็กต์ในเซลล์ใดเซลล์หนึ่งจึงมีค่าเหมือนกันสำหรับแอตทริบิวต์อื่นๆ