Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

metarules มีประโยชน์อย่างไรในการทำเหมืองข้อมูล?


การทำเหมืองข้อมูลเป็นกระบวนการในการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มใหม่ที่เป็นประโยชน์ โดยการถ่ายโอนข้อมูลจำนวนมากที่บันทึกไว้ในที่เก็บ โดยใช้เทคโนโลยีการจดจำรูปแบบ รวมทั้งเทคนิคทางสถิติและคณิตศาสตร์ เป็นการวิเคราะห์ชุดข้อมูลที่เป็นข้อเท็จจริงเพื่อค้นหาความสัมพันธ์ที่ไม่สงสัย และเพื่อสรุปบันทึกด้วยวิธีใหม่ที่มีทั้งเหตุผลและเป็นประโยชน์ต่อเจ้าของข้อมูล

เป็นขั้นตอนของการคัดเลือก สำรวจ และจำลองข้อมูลปริมาณมากเพื่อค้นหาความสม่ำเสมอหรือความสัมพันธ์ที่ไม่เคยทราบมาก่อนเพื่อให้ได้ผลลัพธ์ที่ชัดเจนและเป็นประโยชน์สำหรับเจ้าของฐานข้อมูล

การทำเหมืองข้อมูลคล้ายกับวิทยาศาสตร์ข้อมูล ดำเนินการโดยบุคคลในสถานการณ์เฉพาะในชุดข้อมูลเฉพาะโดยมีวัตถุประสงค์ เฟสนี้ประกอบด้วยบริการหลายประเภท เช่น การทำเหมืองข้อความ การทำเหมืองเว็บ การทำเหมืองเสียงและวิดีโอ การทำเหมืองข้อมูลด้วยภาพ และการทำเหมืองโซเชียลมีเดีย เสร็จสมบูรณ์ผ่านซอฟต์แวร์ที่เรียบง่ายหรือเฉพาะเจาะจงอย่างมาก

Metarules ช่วยให้ผู้ใช้สามารถกำหนดรูปแบบวากยสัมพันธ์ของกฎที่เกี่ยวข้องกับการขุด แบบฟอร์มกฎสามารถใช้เป็นข้อจำกัดในการปรับปรุงประสิทธิภาพของขั้นตอนการขุด Metarules อาจขึ้นอยู่กับประสบการณ์ของนักวิเคราะห์ ความคาดหวัง หรือสัญชาตญาณเกี่ยวกับข้อมูล หรือสามารถสร้างได้โดยอัตโนมัติขึ้นอยู่กับสคีมาของฐานข้อมูล

การขุดด้วยเมทารูล − พิจารณาว่าในฐานะนักวิเคราะห์ตลาดของ AllElectronics นั้นสามารถเข้าถึงข้อมูลที่กำหนดลูกค้า (รวมถึงอายุของลูกค้า ที่อยู่ และอันดับเครดิต) และรายการธุรกรรมของลูกค้า

สามารถค้นหาความสัมพันธ์ระหว่างคุณลักษณะของลูกค้าและสินค้าที่ลูกค้าซื้อ อย่างไรก็ตาม แทนที่จะค้นหากฎการเชื่อมโยงที่สะท้อนถึงความสัมพันธ์เหล่านี้ เราสนใจเพียงการตัดสินใจว่าคุณลักษณะของลูกค้าคู่ใดจะช่วยเพิ่มยอดขายซอฟต์แวร์สำนักงานได้

ตัวอย่างของ metarule ดังกล่าวคือ

พี1 (X, Y)∧ P2 (X, W) ⇒ ซื้อ (X, “ซอฟต์แวร์สำนักงาน”)

โดยที่ P1 และ P2 เป็นตัวแปรภาคแสดงที่สร้างอินสแตนซ์ให้กับแอตทริบิวต์จากฐานข้อมูลที่กำหนดในระหว่างขั้นตอนการขุด X คือตัวแปรที่กำหนดลูกค้า และ Y และ W รับค่าของแอตทริบิวต์ที่กำหนดให้กับ P1 และ P2 ตามลำดับ

โดยทั่วไป ผู้ใช้สามารถกำหนดรายการของแอตทริบิวต์ที่จะจัดการกับการสร้างอินสแตนซ์ด้วย P1 และ P2 . ดังนั้นจึงสามารถใช้ชุดเริ่มต้นได้

โดยทั่วไป metarule จะสร้างสมมติฐานเกี่ยวกับความสัมพันธ์ที่ผู้ใช้มีส่วนเกี่ยวข้องในการรับรู้หรือการยืนยัน ระบบการทำเหมืองข้อมูลสามารถค้นหากฎที่เชื่อมต่อกับ metarule ที่กำหนด ตัวอย่างเช่น

age(X, “30...39”)∧income(X, “41K...60K”) ⇒ ซื้อ (X, “office software”)