เทคนิคข้อยกเว้นตามลำดับจำลองวิธีการที่มนุษย์สามารถแยกแยะชุดที่ผิดปกติออกจากลำดับของวัตถุที่คาดว่าจะเหมือนกันได้ ช่วยให้ข้อมูลมีความซ้ำซ้อนโดยปริยาย
จากชุดข้อมูล D ของ n วัตถุ จะสร้างลำดับของชุดย่อย {D1 , D2 ,..., Dม } ของวัตถุเหล่านี้ที่มี 2 ≤ m ≤ n รวมทั้ง
$$\mathrm{D_{j−1}\subset D_{j}\:\:where\:D_{j}\subseteq D}$$
ความแตกต่างจะได้รับการประเมินระหว่างชุดย่อยในซีรีส์ เทคนิคนี้เรียนรู้คำศัพท์ดังต่อไปนี้ -
ชุดข้อยกเว้น − นี่คือชุดของการเบี่ยงเบนหรือค่าผิดปกติ ถูกกำหนดให้เป็นเซตย่อยที่เล็กที่สุดของออบเจกต์ซึ่งการลบออกส่งผลให้ลดความไม่เหมือนในชุดที่เหลือสูงสุด
ฟังก์ชันความแตกต่าง − ฟังก์ชันนี้ไม่ต้องการระยะเมตริกระหว่างวัตถุ กำหนดชุดของอ็อบเจ็กต์ คืนค่าต่ำถ้าอ็อบเจ็กต์เหมือนกัน ยิ่งความแตกต่างระหว่างอ็อบเจ็กต์สูงขึ้น ค่าที่ฟังก์ชันส่งคืนก็จะยิ่งสูงขึ้น
ความแตกต่างของชุดย่อยจะถูกคำนวณแบบเพิ่มหน่วยขึ้นกับชุดย่อยก่อนหน้าในลำดับ รับเซตย่อยของ n จำนวน {x1 ,..., xn } ฟังก์ชัน dissimilarity ที่เป็นไปได้คือความแปรปรวนของตัวเลขในชุด
$$\mathrm{\frac{1}{n}\displaystyle\sum\limits_{i=1}^n (x_{i}-x^{'})^2}$$
โดยที่ x ' คือค่าเฉลี่ยของตัวเลข n ในชุด สำหรับสตริงอักขระ ฟังก์ชัน dissimilarity อาจอยู่ในการออกแบบสตริงรูปแบบ (เช่น รวมถึงอักขระตัวแทน) ที่สามารถครอบคลุมรูปแบบทั้งหมดที่ดูจนถึงปัจจุบัน ความแตกต่างจะเพิ่มขึ้นเมื่อรูปแบบครอบคลุมบางสตริงใน Dj-1 ไม่ครอบคลุมบางสตริงใน Dj ที่ไม่อยู่ใน Dj-1 .
ฟังก์ชันคาร์ดินัลลิตี้ − โดยปกติแล้วจะเป็นการนับของหลายๆ ออบเจ็กต์ในชุดที่กำหนด
ปัจจัยความเรียบ − ฟังก์ชันนี้คำนวณสำหรับแต่ละชุดย่อยในลำดับ โดยจะประเมินว่าสามารถลดความไม่เหมือนกันได้มากเพียงใดโดยการกำจัดเซตย่อยออกจากชุดออบเจ็กต์เริ่มต้น ค่านี้เป็นอัตราตามจำนวนสมาชิกชุด เซตย่อยที่มีค่าตัวประกอบการปรับให้เรียบสูงสุดคือชุดข้อยกเว้น
ฟังก์ชันการค้นหาชุดข้อยกเว้นสามารถเป็นแบบ NP-hard (เช่น ยาก) วิธีการแบบต่อเนื่องสามารถคำนวณได้และสามารถดำเนินการได้โดยใช้อัลกอริธึมเชิงเส้น
แทนที่จะประเมินความแตกต่างของชุดย่อยปัจจุบันที่เกี่ยวข้องกับชุดเสริม อัลกอริธึมจะเลือกชุดของชุดย่อยจากชุดสำหรับการวิเคราะห์ สำหรับแต่ละชุดย่อย จะกำหนดความแตกต่างของความต่างของชุดย่อยที่เกี่ยวข้องกับชุดย่อยก่อนหน้าในลำดับ