Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ชุดรายการความถี่สูงสุดคืออะไร?


ชุดไอเท็มที่มีความถี่สูงสุดจะแสดงเป็นชุดไอเท็มที่ใช้บ่อยซึ่งไม่มีชุดซูเปอร์เซ็ตโดยตรงอยู่บ่อยครั้ง ชุดรายการในตาข่ายแบ่งออกเป็นสองกลุ่มเช่นกลุ่มที่มีบ่อยๆและกลุ่มที่ไม่บ่อยนัก เส้นขอบของชุดรายการที่ใช้บ่อย ซึ่งกำหนดโดยเส้นประ

ชุดแต่ละรายการที่อยู่เหนือเส้นขอบนั้นใช้บ่อย ในขณะที่ชุดที่อยู่ใต้เส้นขอบ (โหนดที่แรเงา) นั้นไม่บ่อย ระหว่างชุดไอเท็มที่อาศัยอยู่ใกล้ชายแดน {a, d}, {a, c, e} และ {b, c, d, e} จะถือว่าเป็นชุดไอเท็มที่มีความถี่สูงสุดเนื่องจาก superset โดยตรงไม่บ่อยนัก

ชุดรายการรวมถึง {a, d} เป็นชุดสูงสุดเนื่องจากบางชุด supersets โดยตรง {a, b, d}, {a, c, d} และ {a, d, e} ไม่บ่อยนัก ในทางตรงกันข้าม {a, c} ไม่ใช่ค่าสูงสุดเนื่องจาก supersets โดยตรง {a, c, e} เกิดขึ้นบ่อย

ชุดรายการที่ใช้บ่อยสูงสุดสนับสนุนคำอธิบายสั้นๆ ของชุดรายการที่ใช้บ่อยอย่างเพียงพอ กล่าวอีกนัยหนึ่ง พวกมันสร้างชุดของไอเท็มที่เล็กที่สุด ซึ่งสามารถดึงชุดไอเท็มที่ใช้บ่อยได้ ตัวอย่างเช่น ชุดรายการที่ใช้บ่อยสามารถแบ่งออกเป็นสองกลุ่มดังนี้ −

  • ชุดรายการที่ใช้บ่อยที่ขึ้นต้นด้วยรายการ a และสามารถรวมรายการ c, d หรือ e ได้ กลุ่มนี้ประกอบด้วยชุดรายการ ได้แก่ {a), {a, c), {a, d}, {a, e} และ {a, c, e}.

  • ชุดรายการที่ใช้บ่อยที่ขึ้นต้นด้วยรายการ b, c, d หรือ e กลุ่มนี้ประกอบด้วยชุดรายการต่างๆ ได้แก่ {b}, {b, c}, {c, d}, {b, c, d, e} เป็นต้น

ชุดรายการที่ใช้บ่อยในกลุ่มแรกคือชุดย่อยของ {a, c, e} หรือ {a, d} ในขณะที่ชุดที่ใช้ในกลุ่มที่สองคือชุดย่อยของ {b, c, d, e} ดังนั้น ชุดไอเท็มที่ใช้บ่อยสูงสุด {a, c, e}, {a, d} และ {b, c, d, e} สนับสนุนคำอธิบายสั้นๆ ของชุดไอเท็มที่ใช้บ่อย

ชุดรายการที่มีความถี่สูงสุดสนับสนุนคำอธิบายที่มีค่าสำหรับชุดข้อมูลที่สามารถสร้างชุดรายการที่มีความถี่สูงมาก เนื่องจากมีชุดรายการที่ใช้บ่อยหลายชุดในข้อมูลดังกล่าว วิธีนี้ใช้ได้จริงก็ต่อเมื่อมีอัลกอริธึมที่มีประสิทธิภาพเกิดขึ้นเพื่อค้นหาชุดไอเท็มที่มีความถี่สูงสุดอย่างชัดเจนโดยไม่ต้องแจกแจงชุดย่อยบางชุด

แม้จะสนับสนุนคำอธิบายแบบย่อ แต่ชุดรายการที่มีความถี่สูงสุดจะไม่รวมข้อมูลสนับสนุนของชุดย่อย ตัวอย่างเช่น การสนับสนุนชุดไอเท็มที่มีความถี่สูงสุด {a,c,e}, {a,d} และ {b,c,d,e} ไม่ได้ให้แนวคิดใดๆ เกี่ยวกับการสนับสนุนชุดย่อยของพวกมัน

จำเป็นต้องมีการส่งผ่านชุดข้อมูลเพิ่มเติมเพื่อตัดสินจำนวนการสนับสนุนของชุดรายการที่ไม่บ่อยสูงสุด ในบางกรณี ขอแนะนำให้ใช้คำอธิบายขั้นต่ำของชุดรายการที่ใช้บ่อยซึ่งเก็บรักษาข้อมูลสนับสนุนไว้