Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

เทคนิคการยกเว้นตามลำดับคืออะไร?


เทคนิคข้อยกเว้นตามลำดับจำลองวิธีการที่มนุษย์สามารถแยกแยะชุดที่ผิดปกติออกจากลำดับของวัตถุที่คาดว่าจะเหมือนกันได้ ช่วยให้ข้อมูลมีความซ้ำซ้อนโดยปริยาย

จากชุดข้อมูล D ของ n วัตถุ จะสร้างลำดับของชุดย่อย {D1 , D2 ,..., D } ของวัตถุเหล่านี้ที่มี 2 ≤ m ≤ n รวมทั้ง

$$\mathrm{D_{j−1}\subset D_{j}\:\:where\:D_{j}\subseteq D}$$

ความแตกต่างจะได้รับการประเมินระหว่างชุดย่อยในซีรีส์ เทคนิคนี้เรียนรู้คำศัพท์ดังต่อไปนี้ -

ชุดข้อยกเว้น − นี่คือชุดของการเบี่ยงเบนหรือค่าผิดปกติ ถูกกำหนดให้เป็นเซตย่อยที่เล็กที่สุดของออบเจกต์ซึ่งการลบออกส่งผลให้ลดความไม่เหมือนในชุดที่เหลือสูงสุด

ฟังก์ชันความแตกต่าง − ฟังก์ชันนี้ไม่ต้องการระยะเมตริกระหว่างวัตถุ กำหนดชุดของอ็อบเจ็กต์ คืนค่าต่ำถ้าอ็อบเจ็กต์เหมือนกัน ยิ่งความแตกต่างระหว่างอ็อบเจ็กต์สูงขึ้น ค่าที่ฟังก์ชันส่งคืนก็จะยิ่งสูงขึ้น

ความแตกต่างของชุดย่อยจะถูกคำนวณแบบเพิ่มหน่วยขึ้นกับชุดย่อยก่อนหน้าในลำดับ รับเซตย่อยของ n จำนวน {x1 ,..., xn } ฟังก์ชัน dissimilarity ที่เป็นไปได้คือความแปรปรวนของตัวเลขในชุด

$$\mathrm{\frac{1}{n}\displaystyle\sum\limits_{i=1}^n (x_{i}-x^{'})^2}$$

โดยที่ x ' คือค่าเฉลี่ยของตัวเลข n ในชุด สำหรับสตริงอักขระ ฟังก์ชัน dissimilarity อาจอยู่ในการออกแบบสตริงรูปแบบ (เช่น รวมถึงอักขระตัวแทน) ที่สามารถครอบคลุมรูปแบบทั้งหมดที่ดูจนถึงปัจจุบัน ความแตกต่างจะเพิ่มขึ้นเมื่อรูปแบบครอบคลุมบางสตริงใน Dj-1 ไม่ครอบคลุมบางสตริงใน Dj ที่ไม่อยู่ใน Dj-1 .

ฟังก์ชันคาร์ดินัลลิตี้ − โดยปกติแล้วจะเป็นการนับของหลายๆ ออบเจ็กต์ในชุดที่กำหนด

ปัจจัยความเรียบ − ฟังก์ชันนี้คำนวณสำหรับแต่ละชุดย่อยในลำดับ โดยจะประเมินว่าสามารถลดความไม่เหมือนกันได้มากเพียงใดโดยการกำจัดเซตย่อยออกจากชุดออบเจ็กต์เริ่มต้น ค่านี้เป็นอัตราตามจำนวนสมาชิกชุด เซตย่อยที่มีค่าตัวประกอบการปรับให้เรียบสูงสุดคือชุดข้อยกเว้น

ฟังก์ชันการค้นหาชุดข้อยกเว้นสามารถเป็นแบบ NP-hard (เช่น ยาก) วิธีการแบบต่อเนื่องสามารถคำนวณได้และสามารถดำเนินการได้โดยใช้อัลกอริธึมเชิงเส้น

แทนที่จะประเมินความแตกต่างของชุดย่อยปัจจุบันที่เกี่ยวข้องกับชุดเสริม อัลกอริธึมจะเลือกชุดของชุดย่อยจากชุดสำหรับการวิเคราะห์ สำหรับแต่ละชุดย่อย จะกำหนดความแตกต่างของความต่างของชุดย่อยที่เกี่ยวข้องกับชุดย่อยก่อนหน้าในลำดับ