มีสามมาตรการที่ใช้เป็นตัวบ่งชี้ข้อยกเว้นเพื่อรองรับการจดจำความผิดปกติของข้อมูล การวัดเหล่านี้แสดงถึงระดับของความประหลาดใจที่ปริมาณในเซลล์มีอิทธิพลต่อค่าที่คาดหวัง
การวัดจะถูกคำนวณและเชื่อมโยงกับทุกเซลล์ สำหรับการรวมทุกระดับ มีดังต่อไปนี้ รวมถึงการวัด SelfExp, InExp และ PathExp ที่อิงตามแนวทางเชิงตัวเลขสำหรับการวิเคราะห์ตาราง
ค่าเซลล์ได้รับการปฏิบัติ ข้อยกเว้นขึ้นอยู่กับว่าค่านั้นแตกต่างจากค่าที่คาดไว้มากน้อยเพียงใด โดยค่าที่คาดหวังจะถูกตัดสินด้วยแบบจำลองทางสถิติ ความแตกต่างระหว่างค่าเซลล์ที่กำหนดและค่าที่คาดหวังเรียกว่าค่าคงเหลือ
ตามสัญชาตญาณ ยิ่งสารตกค้างสูงเท่าใด ค่าเซลล์ที่เกินมาก็จะยิ่งเป็นข้อยกเว้น การเปรียบเทียบค่าคงเหลือกำหนดให้เราต้องปรับขนาดตามค่าเบี่ยงเบนมาตรฐานที่คาดไว้ซึ่งสัมพันธ์กับค่าคงเหลือ ค่าเซลล์จึงถือเป็นข้อยกเว้นหากค่าคงเหลือที่ปรับขนาดเกินเกณฑ์ที่กำหนดไว้ล่วงหน้า
การวัด SelfExp, InExp และ PathExp อิงตามส่วนที่เหลือตามมาตราส่วนนี้ ค่าที่คาดหวังของเซลล์ที่กำหนดคือบริการของกลุ่มตามระดับที่ใหญ่กว่าของเซลล์ที่จัดเตรียมไว้ ตัวอย่างเช่น เมื่อกำหนดลูกบาศก์ที่มีสามมิติ A, B และ C ค่าที่คาดไว้สำหรับเซลล์ที่ตำแหน่ง ith ใน A ตำแหน่งที่ j ใน B และตำแหน่ง k ใน C คือฟังก์ชันของ γ, γAi , γBj , γCk , γ ABij , γ ACik , และ γ BCjk , ซึ่งเป็นสัมประสิทธิ์ของแบบจำลองตัวเลขที่ใช้
ค่าสัมประสิทธิ์จะเป็นไปตามความแตกต่างของค่าในระดับที่มากขึ้นซึ่งขึ้นอยู่กับการแสดงผลทั่วไปที่เกิดขึ้นจากการดูที่การรวมในระดับที่มากขึ้น ในแนวทางนี้ คุณภาพข้อยกเว้นของค่าในเซลล์จะขึ้นอยู่กับข้อยกเว้นของค่าที่ตามมา ดังนั้น เมื่อดูข้อยกเว้น ผู้ใช้จึงจำเป็นต้องวิเคราะห์ข้อยกเว้นโดยเจาะลึก
การคำนวณนี้ประกอบด้วยสามขั้นตอนดังต่อไปนี้ −
-
ขั้นตอนแรกประกอบด้วยการคำนวณค่ารวมที่กำหนดคิวบ์ รวมถึงผลรวมหรือการนับ ซึ่งจะมีการค้นพบข้อยกเว้น
-
ขั้นตอนที่สองประกอบด้วยการติดตั้งแบบจำลองซึ่งกำหนดสัมประสิทธิ์และใช้ในการคำนวณค่าคงเหลือที่ได้มาตรฐาน เฟสนี้สามารถซ้อนทับกับเฟสแรกได้เนื่องจากการคำนวณเหมือนกัน
-
ระยะที่สามจะคำนวณค่า SelfExp, InExp และ PathExp ขึ้นอยู่กับค่าคงเหลือที่เป็นมาตรฐาน ระยะนี้เทียบเท่ากับระยะที่ 1 ในเชิงคำนวณ ดังนั้น การคำนวณคิวบ์ข้อมูลสำหรับการสำรวจที่ขับเคลื่อนด้วยการค้นพบจึงสำเร็จลุล่วงได้อย่างมีประสิทธิภาพ