Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

อะไรคือปัญหาของการตรวจจับความผิดปกติ?


การตรวจจับความผิดปกติมีประเด็นต่างๆ ดังนี้ -

จำนวนแอตทริบิวต์ที่ใช้ในการกำหนดความผิดปกติ − คำถามของวัตถุใดสิ่งหนึ่งผิดปกติขึ้นอยู่กับคุณลักษณะแต่ละอย่างคือคำถามว่าค่าของวัตถุสำหรับแอตทริบิวต์นั้นผิดปกติหรือไม่ เนื่องจากวัตถุสามารถมีแอตทริบิวต์ได้หลายแบบ จึงมีค่าผิดปกติสำหรับแอตทริบิวต์ต่างๆ ได้ แต่ค่าปกติสำหรับแอตทริบิวต์หลายรายการ

ยิ่งไปกว่านั้น วัตถุสามารถมีความผิดปกติได้แม้ว่าจะไม่มีค่าแอตทริบิวต์ใดๆ ก็ตามที่มีความผิดปกติอย่างอิสระก็ตาม ตัวอย่างเช่น เป็นเรื่องปกติที่จะมีบุคคลที่สูง 2 ฟุต (เด็ก) หรือมีน้ำหนัก 300 ปอนด์ แต่ผิดปกติที่จะมีคนสูง 2 ฟุตที่มีน้ำหนัก 300 ปอนด์

คำอธิบายของความผิดปกติควรกำหนดวิธีการใช้ค่าของแอตทริบิวต์หลายรายการเพื่อตัดสินใจว่าวัตถุนั้นเป็นความผิดปกติหรือไม่ นี่เป็นปัญหาสำคัญเมื่อมิติข้อมูลมีขนาดใหญ่

มุมมองทั่วโลกกับท้องถิ่น − สิ่งของอาจดูผิดปกติสำหรับสิ่งของทั้งหมด แต่ไม่เกี่ยวกับสิ่งของในละแวกใกล้เคียง ตัวอย่างเช่น คนที่มีความสูง 6 ฟุต 5 นิ้วสูงมากสำหรับประชากรทั่วไป แต่ไม่เกี่ยวกับนักบาสเกตบอลมืออาชีพ

ระดับที่จุดนั้นเป็นความผิดปกติ − การประเมินวัตถุเป็นความผิดปกติได้รับการบันทึกโดยวิธีการบางอย่างในรูปแบบเลขฐานสอง:วัตถุนั้นเป็นความผิดปกติหรือไม่ใช่ โดยทั่วไป สิ่งนี้ไม่ได้สะท้อนถึงความเป็นจริงพื้นฐานที่ว่าวัตถุบางอย่างมีความผิดปกติที่รุนแรงกว่าวัตถุอื่นๆ ดังนั้นจึงเป็นเรื่องที่น่าสนใจที่จะมีการประเมินหลายครั้งเกี่ยวกับระดับของวัตถุที่มีความผิดปกติ การประเมินนี้เรียกว่าคะแนนความผิดปกติหรือค่าผิดปกติ

ระบุความผิดปกติทีละอย่างกับความผิดปกติหลายอย่างพร้อมกัน − ในบางวิธี ความผิดปกติจะถูกกำจัดทีละอย่าง กล่าวคือ ตัวอย่างที่ผิดปกติมากที่สุดจะถูกจดจำและลบออก จากนั้นขั้นตอนจะทำซ้ำ สำหรับเทคนิคหลายๆ อย่าง จะระบุชุดของความผิดปกติไว้ด้วยกัน

เทคนิคที่พยายามจำแนกความผิดปกติทีละอย่างมักมีปัญหาที่เรียกว่าการปิดบัง ซึ่งการมีอยู่ของความผิดปกติหลายอย่างปิดบังการมีอยู่ของทั้งหมด ในอีกแง่หนึ่ง เทคนิคที่ระบุค่าผิดปกติหลายค่าพร้อมกันอาจประสบกับการล้นมือ โดยที่วัตถุปกติจะถูกกำหนดเป็นค่าผิดปกติ ในวิธีการแบบอิงแบบจำลอง เอฟเฟกต์เหล่านี้สามารถปรากฏขึ้นได้เนื่องจากความผิดปกติเปลี่ยนแปลงโมเดลข้อมูล

ประสิทธิภาพ − มีความแตกต่างที่สำคัญในต้นทุนการคำนวณของแผนการตรวจจับสิ่งผิดปกติหลายแบบ แบบแผนตามการจำแนกประเภทอาจจำเป็นต้องใช้ทรัพยากรที่จำเป็นเพื่อสร้างแบบจำลองการจัดประเภท แต่โดยทั่วไปแล้วจะมีราคาไม่แพงนัก ในทำนองเดียวกัน วิธีการทางสถิติจะสร้างแบบจำลองทางสถิติและสามารถจัดหมวดหมู่องค์ประกอบในเวลาคงที่ได้