Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การตัดแต่งกิ่งไม้มีแนวทางอย่างไร?


การตัดแต่งกิ่งเป็นขั้นตอนที่ลดขนาดของต้นไม้ตัดสินใจ สามารถลดความเสี่ยงของการจัดวางมากเกินไปโดยการกำหนดขนาดของต้นไม้หรือกำจัดพื้นที่ของต้นไม้ที่รองรับพลังงานน้อย การตัดแต่งกิ่งรองรับโดยการเล็มกิ่งที่ตามหลังความผิดปกติในข้อมูลการฝึกเนื่องจากมีเสียงรบกวนหรือสิ่งผิดปกติ และรองรับต้นไม้ต้นทางด้วยวิธีที่เพิ่มประสิทธิภาพโดยรวมของต้นไม้

โดยทั่วไป วิธีการต่างๆ จะใช้การวัดทางสถิติเพื่อลบแผนกที่มีความน่าเชื่อถือน้อยที่สุด ส่งผลให้การจัดประเภทเร็วขึ้น และปรับปรุงความสามารถของแผนภูมิในการจำแนกประเภทข้อมูลการทดสอบอิสระอย่างเหมาะสม

การตัดแต่งกิ่งต้นไม้มี 2 วิธี ดังนี้ -

วิธีการตัดแต่งกิ่งล่วงหน้า

ในแนวทางก่อนการตัดแต่งกิ่ง ต้นไม้จะถูก "ตัดแต่ง" โดยดำเนินการก่อสร้างตั้งแต่เนิ่นๆ (เช่น โดยกำหนดว่าจะไม่แบ่งหรือแบ่งส่วนย่อยของตัวอย่างการฝึกที่โหนดที่ให้ไว้) เมื่อหยุด โหนดจะเปลี่ยนเป็นใบไม้ ใบไม้สามารถมีอิทธิพลต่อคลาสที่พบบ่อยที่สุดระหว่างตัวอย่างเซตย่อย หรือการแจกแจงความน่าจะเป็นของตัวอย่างเหล่านั้น

เมื่อสร้างต้นไม้ สามารถใช้การวัดที่มีนัยสำคัญทางสถิติ x2 การได้รับข้อมูล ฯลฯ เพื่อสร้างความเอื้ออาทรของการแยก หากการแบ่งพาร์ติชันตัวอย่างที่โหนดสามารถส่งผลให้มีการแบ่งที่ลดลงต่ำกว่าเกณฑ์ที่กำหนดไว้ล่วงหน้า การแบ่งพาร์ติชันของชุดย่อยที่กำหนดจะหยุดลง มีปัญหาในการเลือกเกณฑ์ที่เหมาะสม ธรณีประตูที่สูงอาจส่งผลให้ต้นไม้มีความเรียบง่ายเกินไป ในขณะที่ธรณีประตูที่ต่ำอาจส่งผลให้มีความเรียบง่ายน้อยมาก

วิธีการหลังการตัดแต่งกิ่ง

วิธีการหลังการตัดแต่งกิ่งจะกำจัดกิ่งก้านจากต้นที่ "โตเต็มที่" โหนดต้นไม้ถูกตัดแต่งโดยการกำจัดกิ่งก้านของมัน อัลกอริธึมการตัดราคาความซับซ้อนของราคาเป็นตัวอย่างของวิธีการหลังการตัดแต่งกิ่ง โหนดที่ตัดแต่งแล้วจะกลายเป็นใบไม้และติดป้ายกำกับโดยคลาสที่พบบ่อยที่สุดระหว่างสาขาก่อนหน้า

สำหรับโหนดที่ไม่ใช่ใบไม้แต่ละโหนดในแผนผัง อัลกอริทึมจะคำนวณอัตราข้อผิดพลาดที่คาดไว้ซึ่งสามารถปรากฏขึ้นได้หากทรีย่อยที่โหนดนั้นสั้นลง ถัดไป อัตราข้อผิดพลาดที่คาดไว้จะปรากฏขึ้นหากโหนดไม่ถูกตัดแต่ง คำนวณโดยใช้อัตราข้อผิดพลาดสำหรับแต่ละสาขา เชื่อมต่อด้วยการให้น้ำหนักตามมิติของการสังเกตตามแต่ละสาขา หากการตัดโหนดทำให้มีอัตราข้อผิดพลาดที่คาดไว้สูงขึ้น แผนผังย่อยจะยังคงอยู่ ดังนั้นจึงมีการตัดแต่งกิ่ง

หลังจากสร้างชุดต้นไม้ที่ตัดแต่งกิ่งมากขึ้นแล้ว ชุดทดสอบอิสระสามารถประเมินประสิทธิภาพของต้นไม้แต่ละต้นได้ ควรใช้แผนผังการตัดสินใจที่ลดต้นทุนข้อผิดพลาดที่คาดไว้