Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ROC Curve คืออะไร?


ROC ย่อมาจากลักษณะการทำงานของผู้รับ เส้นโค้ง ROC เป็นเครื่องมือภาพที่สะดวกสำหรับการวิเคราะห์แบบจำลองการจำแนกประเภทสองแบบ เส้นโค้ง ROC ปรากฏขึ้นจากทฤษฎีการตรวจจับสัญญาณที่เกิดขึ้นในช่วงสงครามโลกครั้งที่ 2 เพื่อค้นหาภาพเรดาร์

เส้นโค้ง ROC แสดงการแลกเปลี่ยนระหว่างอัตราบวกจริงหรือความไว (สัดส่วนของสิ่งอันดับบวกที่รับรู้) และอัตราบวกเท็จ (สัดส่วนของสิ่งอันดับเชิงลบที่รับรู้อย่างไม่ถูกต้องว่าเป็นค่าบวก) สำหรับแบบจำลองที่กำหนด

จากปัญหาสองระดับ ทำให้เราสามารถคาดการณ์การแลกเปลี่ยนระหว่างอัตราที่แบบจำลองสามารถระบุกรณี 'ใช่' ได้อย่างแม่นยำ เทียบกับอัตราที่เข้าใจผิดว่ากรณี 'ไม่ใช่' เป็น 'ใช่' สำหรับหลายส่วน ” ของชุดทดสอบ อัตราบวกที่แท้จริงเพิ่มขึ้นบางส่วนปรากฏขึ้นที่ค่าของการเพิ่มขึ้นของอัตราผลบวกเท็จ พื้นที่ใต้เส้นโค้ง ROC คือการประเมินความถูกต้องของแบบจำลอง

มันสามารถใช้เส้นโค้ง ROC สำหรับแบบจำลองการจัดประเภทที่กำหนด M แบบจำลองควรจะสามารถส่งคืนความน่าจะเป็นหรือการจัดอันดับสำหรับคลาสที่คาดการณ์ของทูเปิลการทดสอบทุกตัว จำเป็นต้องจัดลำดับการทดสอบทูเปิลในลำดับจากมากไปน้อย โดยที่ตัวแยกประเภทคิดว่าโดยทั่วไปแล้วเป็นของคลาสบวกหรือ 'ใช่' เกิดขึ้นที่ด้านบนสุดของรายการ

ตัวแยกประเภทแบบไร้เดียงสาและแบบ backpropagation มีความเหมาะสม ในขณะที่รวมทั้งตัวแยกประเภทการตัดสินใจ สามารถเปลี่ยนได้ง่ายๆ เพื่อส่งคืนการแจกแจงความน่าจะเป็นของคลาสสำหรับทุกการคาดการณ์ แกนแนวตั้งของเส้นโค้ง ROC กำหนดอัตราบวกที่แท้จริง แกนนอนกำหนดอัตราบวกลวง กราฟ ROC สำหรับ M ถูกพล็อตดังนี้

โดยเริ่มต้นที่มุมล่างซ้าย (โดยที่อัตราบวกจริงและอัตราบวกเท็จเป็นทั้ง 0) สามารถทดสอบเลเบลคลาสจริงของ tuple ได้ที่รายการแรก หากเป็นค่าบวกจริง (เช่น ทูเพิลบวกที่กำหนดอย่างถูกต้อง) บนเส้นโค้ง ROC ค่านี้สามารถเปลี่ยนแปลงและพล็อตจุดได้

จะแสดงเส้นโค้ง ROC ของแบบจำลองการจำแนกประเภทสองแบบ โครงเรื่องยังแสดงเส้นทแยงมุมซึ่งสำหรับผลบวกที่แท้จริงของแต่ละแบบจำลองนั้น โดยทั่วไปแล้วจะพบกับผลบวกที่ผิดพลาด

ดังนั้น ยิ่งเส้นโค้ง ROC ของแบบจำลองอยู่ใกล้กับเส้นทแยงมุมมากเท่าใด แบบจำลองก็จะยิ่งมีประสิทธิภาพน้อยลงเท่านั้น หากโมเดลดีที่สุด เดิมทีอาจพบผลบวกที่แท้จริง เนื่องจากอาจเปลี่ยนอันดับลงได้ ดังนั้นเส้นโค้งสามารถเลื่อนขึ้นสูงชันจากศูนย์ได้ ต่อมา เนื่องจากสามารถเริ่มพบผลบวกจริงน้อยลงและผลบวกลวงขึ้นเรื่อยๆ เส้นโค้งจะปิดและกลายเป็นแนวนอนมากขึ้น