Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

คุณลักษณะของลักษณนามใกล้เคียงที่สุดคืออะไร?


กฎเพื่อนบ้านที่ใกล้ที่สุดสร้างประสิทธิภาพสูงบ่อยครั้ง โดยไม่มีข้อสันนิษฐานก่อนหน้านี้เกี่ยวกับการจัดสรรจากอินสแตนซ์การฝึกอบรมที่ถูกดึงออกมา ประกอบด้วยชุดฝึกอบรมกรณีศึกษาทั้งด้านบวกและด้านลบ ตัวอย่างใหม่ถูกกำหนดโดยการคำนวณระยะทางไปยังกรณีการฝึกอบรมที่สะดวก เครื่องหมายของจุดนั้นจะเป็นตัวกำหนดการจัดกลุ่มตัวอย่าง

ตัวแยกประเภท k-NN ส่งเสริมแนวคิดนี้โดยนำจุดที่ใกล้ที่สุด k มาสร้างเครื่องหมายของคนส่วนใหญ่ บ่อยครั้งให้เลือก k เล็กและคี่เพื่อแบ่งความสัมพันธ์ (โดยทั่วไปคือ 1, 3 หรือ 5) ค่า k ที่มากขึ้นช่วยลดผลกระทบของจุดรบกวนภายในชุดข้อมูลการฝึก และตัวเลือกของ k จะถูกนำไปใช้ผ่านการตรวจสอบความถูกต้อง

Nearest-Neighbor มีลักษณะหลายประการ ดังนี้ −

การจำแนกประเภทเพื่อนบ้านที่ใกล้ที่สุดเป็นองค์ประกอบของแนวทางทั่วไปที่เรียกว่าการเรียนรู้ตามอินสแตนซ์ จำเป็นต้องมีอินสแตนซ์การฝึกอบรมเฉพาะเพื่อสร้างการคาดคะเนโดยไม่ต้องสนับสนุนสิ่งที่เป็นนามธรรม (หรือแบบจำลอง) ที่ได้มาจากข้อมูล

อัลกอริธึมการเรียนรู้ตามอินสแตนซ์จำเป็นต้องใช้การวัดระยะใกล้เพื่อตัดสินความคล้ายคลึงหรือระยะทางระหว่างอินสแตนซ์ และฟังก์ชันการจัดหมวดหมู่ที่กู้คืนคลาสที่คาดการณ์ไว้ของอินสแตนซ์ทดสอบโดยขึ้นอยู่กับความใกล้ชิดกับอินสแตนซ์อื่นๆ

ผู้เรียนที่เกียจคร้านรวมถึงตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุดไม่จำเป็นต้องสร้างแบบจำลอง แต่การกำหนดตัวอย่างการทดสอบนั้นค่อนข้างถูก เพราะจำเป็นต้องคำนวณค่าความใกล้เคียงแยกกันจากตัวอย่างการทดสอบและการฝึก ในทางตรงกันข้าม ผู้เรียนที่กระตือรือร้นจะใช้ทรัพยากรคอมพิวเตอร์จำนวนมากเพื่อสร้างแบบจำลอง เนื่องจากมีการสร้างแบบจำลองขึ้น การกำหนดตัวอย่างการทดสอบจึงทำได้รวดเร็วอย่างสมบูรณ์

ตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุดสร้างการคาดการณ์โดยขึ้นอยู่กับข้อมูลในเครื่อง ในขณะที่แผนผังการตัดสินใจและตัวแยกประเภทตามกฎพยายามค้นหาแบบจำลองส่วนกลางที่เหมาะกับพื้นที่อินพุตทั้งหมด เนื่องจากมีการสร้างการตัดสินใจจำแนกประเภทในพื้นที่ ตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุดจึงได้รับผลกระทบจากเสียงรบกวน

ตัวจำแนกประเภทเพื่อนบ้านที่ใกล้ที่สุดสามารถกำหนดขอบเขตการตัดสินใจตามอำเภอใจได้ ขอบเขตดังกล่าวสนับสนุนการแสดงโมเดลแบบไดนามิกมากขึ้น ซึ่งแตกต่างจากแผนผังการตัดสินใจและตัวแยกประเภทตามกฎที่ถูกบังคับให้สร้างขอบเขตการตัดสินใจเป็นเส้นตรง

ตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุดสามารถทำนายเท็จได้ เว้นแต่จะมีการวัดความใกล้เคียงที่เหมาะสมและขั้นตอนก่อนการประมวลผลข้อมูล ตัวอย่างเช่น ให้พิจารณาว่าจำเป็นต้องกำหนดกลุ่มคนตามคุณลักษณะต่างๆ เช่น ส่วนสูง (หน่วยเป็นเมตร) และน้ำหนัก (หน่วยเป็นปอนด์)

แอตทริบิวต์ความสูงมีความแปรปรวนต่ำตั้งแต่ 1.5 ม. ถึง 1.85 ม. ในขณะที่แอตทริบิวต์น้ำหนักสามารถเปลี่ยนจาก 90 lb. เป็น 250 lb. หากไม่นับมาตราส่วนของแอตทริบิวต์ในแอปพลิเคชัน การวัดระยะใกล้เคียงสามารถถูกครอบงำด้วย ความแตกต่างในน้ำหนักของบุคคล