Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

เกณฑ์ของการทำเหมืองรูปแบบบ่อยคืออะไร?


มีหลายเกณฑ์ของการทำเหมืองรูปแบบบ่อยครั้งซึ่งมีดังนี้ -

ขึ้นอยู่กับความสมบูรณ์ของรูปแบบที่จะขุด − มันสามารถขุดคอลเลกชั่นทั้งหมดของชุดไอเท็มที่ใช้บ่อย ชุดไอเท็มที่ปิดบ่อย และชุดไอเท็มที่มีความถี่สูงสุดทั้งหมด โดยให้เกณฑ์ขั้นต่ำการสนับสนุน

นอกจากนี้ยังสามารถดึงชุดไอเท็มที่จำกัดความถี่ได้ (มันสามารถตอบสนองชุดของข้อจำกัดที่ผู้ใช้กำหนด), ชุดไอเท็มที่ใช้บ่อยโดยประมาณ (สามารถเปลี่ยนได้เฉพาะจำนวนการสนับสนุนโดยประมาณสำหรับชุดไอเท็มที่ขุดบ่อย), ชุดไอเท็มบ่อยครั้งที่ใกล้เคียงกัน (สามารถนับจำนวนการสนับสนุนได้ ของชุดรายการที่ค่อนข้างตรงกัน), ชุดรายการความถี่สูงสุด k (เช่น ชุดรายการที่บ่อยที่สุด k สำหรับค่าที่ผู้ใช้ระบุ, k) เป็นต้น

มีแอปพลิเคชันหลายตัวที่มีข้อกำหนดหลายประการเกี่ยวกับความสมบูรณ์ของรูปแบบที่จะขุด ซึ่งอาจนำไปสู่การคำนวณและแนวทางการเพิ่มประสิทธิภาพที่แตกต่างกัน

ขึ้นอยู่กับระดับของนามธรรมที่รวมอยู่ในชุดกฎ − มีหลายวิธีสำหรับการขุดกฎการเชื่อมโยงสามารถค้นพบกฎที่แยกออกมาได้หลายระดับ ตัวอย่างเช่น ให้พิจารณาว่ากฎกลุ่มหนึ่งที่ขุดได้เกี่ยวข้องกับกฎต่อไปนี้ โดยที่ X เป็นตัวแปรที่กำหนดลูกค้า -

ซื้อ (X, “คอมพิวเตอร์”) ⇒ ซื้อ (X, “เครื่องพิมพ์ HP”)

ซื้อ (X, “คอมพิวเตอร์แล็ปท็อป”) ⇒ ซื้อ (X, “เครื่องพิมพ์ HP”)

ตามจำนวนมิติข้อมูลที่รวมอยู่ในกฎ − หากรายการหรือแอตทริบิวต์ในกฎการเชื่อมโยงอ้างอิงเพียงมิติเดียว จะเป็นกฎการเชื่อมโยงมิติเดียว

ขึ้นอยู่กับประเภทของค่าที่จัดการในกฎ − หากกฎมีความสัมพันธ์ระหว่างการมีอยู่และไม่มีรายการ กฎนั้นจะเป็นกฎการเชื่อมโยงแบบบูลีน หากกฎกำหนดความสัมพันธ์ระหว่างรายการหรือแอตทริบิวต์เชิงปริมาณ กฎดังกล่าวจะเป็นกฎการเชื่อมโยงเชิงปริมาณ ในกฎเหล่านี้ ค่าเชิงปริมาณสำหรับรายการหรือแอตทริบิวต์จะถูกแยกออกเป็นระยะ

ขึ้นอยู่กับประเภทของกฎที่จะขุด − การวิเคราะห์รูปแบบบ่อยครั้งสามารถสร้างกฎเกณฑ์ได้หลายประเภทและความสัมพันธ์ที่น่าสนใจต่างกัน กฎของสมาคมเป็นกฎประเภทที่มีชื่อเสียงซึ่งสร้างขึ้นจากรูปแบบที่พบบ่อย

ขึ้นอยู่กับประเภทของรูปแบบที่จะขุด − สามารถขุดรูปแบบที่ใช้บ่อยได้หลายประเภทจากชุดข้อมูลหลายประเภท เป้าหมายหลักอยู่ที่การขุดชุดไอเท็มบ่อยครั้ง นั่นคือ การขุดชุดไอเท็มบ่อยครั้ง (ชุดของไอเท็ม) จากชุดข้อมูลธุรกรรมหรือเชิงสัมพันธ์

การทำเหมืองข้อมูลรูปแบบตามลำดับจะค้นหาลำดับที่ตามมาบ่อยครั้งในชุดข้อมูลลำดับ โดยที่ข้อมูลลำดับจะเป็นการเรียงลำดับเหตุการณ์ ตัวอย่างเช่น ด้วยการขุดตามรูปแบบตามลำดับ มันสามารถศึกษาชุดรายการที่มีการซื้อโดยทั่วไป ตัวอย่างเช่น ผู้ใช้สามารถมีแนวโน้มที่จะซื้อพีซีก่อน ตามด้วยกล้องดิจิตอล แล้วก็การ์ดหน่วยความจำ