Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ROC คืออะไร?


ROC ย่อมาจากเส้นโค้งลักษณะการทำงานของเครื่องรับ เป็นวิธีการแบบกราฟิกสำหรับแสดงการแลกเปลี่ยนระหว่างอัตราผลบวกที่แท้จริงและอัตราผลบวกลวงของตัวแยกประเภท ในกราฟ ROC อัตราบวกที่แท้จริง (TPR) จะถูกพล็อตไว้ข้างหน้าแกน g และอัตราผลบวกลวง (FPR) จะแสดงบนแกน r จุดที่อยู่ข้างหน้าเส้นโค้งแต่ละจุดมีความสัมพันธ์กับโมเดลตัวใดตัวหนึ่งที่ลักษณนามกำหนด

มีจุดวิกฤตหลายจุดตามเส้นโค้ง ROC ที่มีการตีความที่รู้จักกันดี -

(TPR:O, FPR:0) - Model ทำนายทุกอินสแตนซ์เป็นคลาสเชิงลบ

(TPR:l, FPR:I) - Model ทำนายทุกอินสแตนซ์เป็นคลาสบวก

(TPR:l, FPR:O) − โมเดลในอุดมคติ

แบบจำลองการจัดประเภทที่ดีที่สุดต้องวางอยู่ใกล้ด้านซ้ายบนมากที่สุด ในขณะที่แบบจำลองที่สร้างการเดาแบบสุ่มต้องอยู่ตามแนวทแยงหลัก โดยเชื่อมโยงจุดต่างๆ (TPR:0,FPR:0) และ (TPR:I,FPR:1). การคาดเดาแบบสุ่มกำหนดว่าเร็กคอร์ดถูกกำหนดให้เป็นคลาสบวกที่มีความน่าจะเป็นคงที่ p โดยไม่คำนึงถึงชุดแอตทริบิวต์

มันสามารถวาดเส้นโค้ง ROC ได้ ตัวแยกประเภทต้องสามารถสร้างผลลัพธ์ที่มีค่าต่อเนื่อง ซึ่งสามารถใช้เพื่อจัดอันดับการทำนาย จากข้อมูลที่มีแนวโน้มมากที่สุดที่จะถูกกำหนดให้เป็นคลาสบวกไปจนถึงข้อมูลที่มีโอกาสน้อยที่สุด ผลลัพธ์เหล่านี้สามารถสัมพันธ์กับความน่าจะเป็นหลังที่เกิดจากตัวแยกประเภทแบบเบย์หรือผลลัพธ์ที่เป็นตัวเลขที่พัฒนาโดยโครงข่ายประสาทเทียม กระบวนการต่อไปนี้สามารถใช้เพื่อสร้างเส้นโค้ง ROC ได้ -

กำลังพิจารณาว่าเอาท์พุตที่มีมูลค่าต่อเนื่องแทนค่าคลาสบวก โดยจะจัดเรียงข้อมูลการทดสอบในชุดค่าเอาต์พุตที่เพิ่มขึ้น

สามารถเลือกข้อมูลการทดสอบที่มีอันดับต่ำที่สุดได้ (เช่น ข้อมูลที่มีค่าเอาต์พุตต่ำสุด) มันสามารถกำหนดข้อมูลที่เลือกและผู้ที่ตามหลังให้กับคลาสบวก วิธีนี้คล้ายกับการกำหนดข้อมูลการทดสอบทั้งหมดเป็นคลาสบวก เนื่องจากอินสแตนซ์เชิงบวกทั้งหมดถูกกำหนดอย่างถูกต้อง และอินสแตนซ์เชิงลบถูกจัดประเภทไม่ถูกต้อง TPR:FPR:I.

สามารถเลือกข้อมูลการทดสอบถัดไปจากรายการที่จัดเรียง โดยกำหนดข้อมูลที่เลือกและข้อมูลที่จัดอันดับตามหลังเป็นค่าบวก ขณะที่ข้อมูลที่อยู่ในอันดับต่ำกว่าเป็นค่าลบ สามารถรีเฟรชจำนวน TP และ FP โดยกำหนดป้ายกำกับคลาสจริงของข้อมูลที่เลือกไว้ก่อนหน้านี้

หากข้อมูลที่เลือกไว้ก่อนหน้านี้เป็นคลาสบวก จำนวน TP จะลดลงและจำนวน FP จะยังคงใกล้เคียงกัน หากข้อมูลที่เลือกไว้ก่อนหน้าเป็นระดับลบ จำนวน FP จะลดลงและจำนวน TP ยังคงใกล้เคียงกัน

ทำซ้ำขั้นตอนที่ 3 และรีเฟรชการนับ TP และ FP ตามลำดับจนกว่าจะเลือกข้อมูลการทดสอบที่มีอันดับที่ใหญ่ที่สุด

สามารถ pIot TPR ตรงข้ามกับ FPR ของตัวแยกประเภทได้