Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การวิเคราะห์คลัสเตอร์ตามข้อจำกัดมีประเภทใดบ้าง


การทำคลัสเตอร์ตามข้อจำกัดจะค้นหาคลัสเตอร์ที่ตรงตามการตั้งค่าหรือข้อจำกัดที่ผู้ใช้ระบุ มันขึ้นอยู่กับลักษณะของข้อจำกัด การจัดกลุ่มตามข้อจำกัดสามารถนำมาใช้แทนวิธีการที่แตกต่างกัน ข้อจำกัดมีหลายประเภทดังนี้ −

  • ข้อจำกัดในแต่ละออบเจ็กต์ − มันสามารถกำหนดข้อจำกัดบนอ็อบเจ็กต์ที่จะจัดกลุ่มได้ ตัวอย่างเช่น ในการใช้งานอสังหาริมทรัพย์ เราสามารถจัดกลุ่มเฉพาะคฤหาสน์หรูที่มีมูลค่ามากกว่าหนึ่งล้านเหรียญเท่านั้น ข้อจำกัดนี้จำกัดการรวบรวมอ็อบเจ็กต์ที่จะจัดกลุ่ม สามารถจัดการได้ง่ายๆ โดยการประมวลผลล่วงหน้า (เช่น การนำการเลือกไปใช้โดยใช้แบบสอบถาม SQL) หลังจากนั้นปัญหาจะลดลงเหลือเพียงตัวอย่างของคลัสเตอร์ที่ไม่มีข้อจำกัด

  • ข้อจำกัดในการเลือกพารามิเตอร์การจัดกลุ่ม − ผู้ใช้สามารถตั้งค่าพื้นที่ที่ต้องการสำหรับพารามิเตอร์คลัสเตอร์แต่ละตัวได้ พารามิเตอร์การจัดกลุ่มโดยทั่วไปค่อนข้างเฉพาะเจาะจงสำหรับอัลกอริธึมการจัดกลุ่มที่กำหนด ตัวอย่างของพารามิเตอร์ประกอบด้วย k ซึ่งเป็นจำนวนกลุ่มที่ต้องการในอัลกอริธึม k หมายถึง หรือ ε (รัศมี) และ MinPts (จำนวนจุดต่ำสุด) ในอัลกอริทึม DBSCAN

    แม้ว่าพารามิเตอร์ที่ผู้ใช้ระบุดังกล่าวสามารถเก็บผลลัพธ์การจัดกลุ่มไว้ได้ แต่โดยทั่วไปแล้วจะจำกัดอยู่ที่อัลกอริธึมเอง ดังนั้น การปรับแต่งและประมวลผลอย่างละเอียดจึงไม่ถือว่าเป็นรูปแบบหนึ่งของการทำคลัสเตอร์ตามข้อจำกัด

  • ข้อจำกัดเกี่ยวกับระยะทางหรือฟังก์ชันความคล้ายคลึงกัน − สามารถกำหนดระยะทางหรือฟังก์ชันความคล้ายคลึงได้หลายแบบสำหรับแอตทริบิวต์ที่แน่นอนของวัตถุที่จะจัดกลุ่ม หรือการวัดระยะทางที่แตกต่างกันสำหรับวัตถุคู่ที่จำกัด ตัวอย่างเช่น เมื่อจัดกลุ่มนักกีฬา สามารถใช้แผนการถ่วงน้ำหนักได้หลายแบบสำหรับส่วนสูง น้ำหนักตัว อายุ และระดับทักษะ

  • ข้อจำกัดที่ผู้ใช้ระบุเกี่ยวกับคุณสมบัติของคลัสเตอร์แต่ละรายการ − ผู้ใช้สามารถระบุคุณสมบัติที่ต้องการของคลัสเตอร์ที่เป็นผลลัพธ์ ซึ่งสามารถยึดกระบวนการจัดกลุ่มไว้ได้

    พิจารณาบริษัทจัดส่งพัสดุที่ต้องการกำหนดสถานที่สำหรับสถานีบริการ k ในเมือง บริษัทมีฐานข้อมูลผู้ใช้ที่ลงทะเบียนชื่อผู้ใช้ สถานที่ ระยะเวลา เนื่องจากลูกค้าเริ่มใช้บริการของบริษัท และราคาเฉลี่ยต่อเดือน สามารถกำหนดปัญหาการเลือกสถานที่นี้เป็นอินสแตนซ์ของการจัดกลุ่มแบบไม่มีข้อจำกัดโดยใช้ฟังก์ชันระยะทางที่คำนวณตามสถานที่ตั้งของลูกค้า

    วิธีที่ชาญฉลาดกว่าคือการแบ่งลูกค้าออกเป็นสองประเภท ได้แก่ ลูกค้าที่มีมูลค่าสูง (ซึ่งต้องการบริการบ่อยครั้งและสม่ำเสมอ) และลูกค้าทั่วไป (ซึ่งต้องการบริการเป็นครั้งคราว) มันสามารถประหยัดค่าใช้จ่ายและสนับสนุนการบริการที่ดี ผู้จัดการเพิ่มข้อจำกัดดังต่อไปนี้ -

    • แต่ละสถานีต้องให้บริการลูกค้าที่มีมูลค่าสูงขั้นต่ำ 100 ราย

    • แต่ละสถานีต้องให้บริการลูกค้าทั่วไปอย่างน้อย 5,000 คน การทำคลัสเตอร์ตามข้อจำกัดจะพิจารณาข้อจำกัดดังกล่าวในระหว่างขั้นตอนการจัดกลุ่ม

  • การจัดกลุ่มแบบกึ่งดูแลโดยอิงตามการควบคุมดูแล "บางส่วน" − คุณภาพของการจัดกลุ่มแบบไม่มีผู้ดูแลสามารถปรับปรุงได้โดยใช้รูปแบบการกำกับดูแลที่อ่อนแอ ซึ่งอาจอยู่ในรูปแบบของข้อจำกัดแบบคู่ (เช่น คู่ของอ็อบเจ็กต์ที่มีป้ายกำกับว่าเป็นเจ้าของโดยคลัสเตอร์เดียวกันหรือต่างกัน) กระบวนการจัดกลุ่มที่มีข้อจำกัดดังกล่าวเรียกว่าการทำคลัสเตอร์แบบกึ่งดูแล