Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

วิธีการตรวจหาค่าผิดปกติมีอะไรบ้าง?


การตรวจจับค่าผิดปกติมีหลายวิธีดังนี้ −

วิธีการดูแล − วิธีการกำกับดูแล แบบจำลองข้อมูลปกติและผิดปกติ ผู้เชี่ยวชาญด้านโดเมนจะทดสอบและติดป้ายกำกับตัวอย่างข้อมูลพื้นฐาน การตรวจจับค่าผิดปกติสามารถจำลองเป็นปัญหาการจำแนกประเภทได้ บริการคือการทำความเข้าใจตัวแยกประเภทที่สามารถระบุค่าผิดปกติได้

ตัวอย่างสามารถใช้สำหรับการฝึกอบรมและการทดสอบ ในแอปพลิเคชันต่างๆ ผู้เชี่ยวชาญสามารถติดป้ายกำกับได้เฉพาะออบเจ็กต์ปกติ และอ็อบเจ็กต์หลายชิ้นที่ไม่ได้เชื่อมต่อกับแบบจำลองของอ็อบเจ็กต์ปกติจะถูกบันทึกว่าเป็นค่าผิดปกติ มีวิธีการต่างๆ ในการสร้างแบบจำลองค่าผิดปกติ และพิจารณาวัตถุที่ไม่เชื่อมต่อกับแบบจำลองของค่าผิดปกติตามปกติ

วิธีการที่ไม่ได้รับการดูแล − ในวิธีการสมัครที่หลากหลาย วัตถุที่มีป้ายกำกับว่า "ปกติ" หรือ "ค่าผิดปกติ" จะไม่สามารถใช้ได้ จึงต้องใช้วิธีการเรียนรู้แบบไม่มีผู้ดูแล วิธีการตรวจหาค่าผิดปกติที่ไม่ได้รับการดูแลจะสร้างสมมติฐานโดยปริยาย เช่น วัตถุปกติจะถูก "จัดกลุ่ม" อย่างมาก

วิธีการตรวจหาค่าผิดปกติที่ไม่ได้รับการดูแลจะคาดการณ์ว่าวัตถุปกติจะเป็นไปตามรูปแบบโดยทั่วไปมากกว่าค่าผิดปกติ วัตถุธรรมดาไม่ต้องตกไปเป็นทีมเดียวที่มีความคล้ายคลึงกันมาก แต่สามารถสร้างหลายกลุ่ม โดยแต่ละกลุ่มมีคุณลักษณะหลายอย่าง

สมมติฐานนี้ไม่สามารถเป็นจริงได้ในบางครั้ง วัตถุปกติไม่ส่งรูปแบบที่แข็งแกร่ง แทนที่จะกระจายอย่างสม่ำเสมอ ค่าผิดปกติส่วนรวม มีความคล้ายคลึงกันมากในพื้นที่ขนาดเล็ก

วิธีการที่ไม่ได้รับการดูแลไม่สามารถระบุค่าผิดปกติดังกล่าวได้อย่างมีประสิทธิภาพ ในบางแอปพลิเคชัน ออบเจ็กต์ปกติจะแยกจากกัน และอ็อบเจ็กต์หลายรายการไม่เป็นไปตามรูปแบบที่เข้มงวด ตัวอย่างเช่น ในบางปัญหาการตรวจจับการบุกรุกและการตรวจจับไวรัสคอมพิวเตอร์ กิจกรรมปกติจะแตกต่างออกไป และบางกิจกรรมก็ไม่ลดลงในคลัสเตอร์คุณภาพสูง

วิธีการจัดกลุ่มบางวิธีสามารถปรับให้เข้ากับวิธีการตรวจหาค่าผิดปกติที่ไม่ได้รับการดูแล แนวคิดหลักคือการค้นหาคลัสเตอร์ก่อน ดังนั้นออบเจ็กต์ข้อมูลที่ไม่ใช่ของคลัสเตอร์บางรายการจึงถูกระบุเป็นค่าผิดปกติ อย่างไรก็ตาม วิธีการดังกล่าวเสื่อมลงจากสองประเด็น ประการแรก ออบเจ็กต์ข้อมูลที่ไม่ได้เป็นของคลัสเตอร์บางตัวอาจเป็นสัญญาณรบกวนแทนที่จะเป็นค่าผิดปกติ อย่างที่สอง การค้นหาคลัสเตอร์ก่อนแล้วค่อยค้นพบค่าผิดปกตินั้นมีค่าใช้จ่ายสูง

วิธีการกึ่งควบคุม − ในหลาย ๆ แอปพลิเคชัน แม้ว่าจะได้รับอินสแตนซ์ที่มีป้ายกำกับ แต่จำนวนอินสแตนซ์ที่ติดป้ายกำกับนั้นมีน้อย อาจพบกรณีที่กลุ่มเล็ก ๆ ของวัตถุปกติและวัตถุผิดปกติถูกติดป้ายกำกับ แต่ข้อมูลบางส่วนไม่มีป้ายกำกับ มีการสร้างวิธีการตรวจหาค่าผิดปกติแบบกึ่งควบคุมเพื่อจัดการกับวิธีการดังกล่าว

วิธีการตรวจหาค่าผิดปกติแบบกึ่งควบคุมดูแลสามารถนำมาประยุกต์ใช้กับแนวทางการเรียนรู้แบบกึ่งควบคุมดูแลได้ ตัวอย่างเช่น เมื่อเข้าถึงวัตถุปกติที่มีป้ายกำกับบางรายการ วัตถุนั้นสามารถใช้วัตถุดังกล่าวกับวัตถุที่ไม่มีป้ายกำกับที่อยู่ใกล้ๆ เพื่อฝึกแบบจำลองสำหรับวัตถุปกติได้ แบบจำลองของออบเจกต์ปกติใช้เพื่อระบุค่าผิดปกติ—อ็อบเจ็กต์ที่ไม่เหมาะกับแบบจำลองของวัตถุปกติจะถูกกำหนดเป็นค่าผิดปกติ