Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

AOI คืออะไร?


AOI ย่อมาจาก Attribute-Oriented Induction แนวทางการเหนี่ยวนำเชิงคุณลักษณะเพื่ออธิบายแนวคิดได้รับการเสนอครั้งแรกในปี 1989 เมื่อไม่กี่ปีก่อนที่จะมีการแนะนำวิธีดาต้าคิวบ์ แนวทางของ data cube นั้นขึ้นอยู่กับมุมมองที่เป็นรูปธรรมของข้อมูลเป็นหลัก ซึ่งโดยทั่วไปแล้วจะมีการคำนวณล่วงหน้าในคลังข้อมูล

โดยทั่วไป จะใช้การรวมแบบออฟไลน์ก่อนที่จะส่ง OLAP หรือแบบสอบถามการทำเหมืองข้อมูลเพื่อการประมวลผล กล่าวอีกนัยหนึ่ง วิธีการเหนี่ยวนำเชิงแอตทริบิวต์โดยทั่วไปจะเป็นวิธีการวิเคราะห์ข้อมูลออนไลน์ที่เน้นการสืบค้น การวางนัยทั่วไป

แนวคิดทั่วไปของการเหนี่ยวนำเชิงแอตทริบิวต์คือการรวบรวมข้อมูลที่เกี่ยวข้องกับงานก่อนโดยใช้การสืบค้นฐานข้อมูล จากนั้นจึงดำเนินการสรุปโดยอิงจากการตรวจสอบจำนวนค่าที่แตกต่างกันของแต่ละแอตทริบิวต์ในการรวบรวมข้อมูลที่เกี่ยวข้อง

ลักษณะทั่วไปถูกนำไปใช้โดยการลบแอตทริบิวต์หรือลักษณะทั่วไปของแอตทริบิวต์ การรวมถูกนำไปใช้โดยการรวม tuples ทั่วไปที่เหมือนกันและสะสมจำนวนเฉพาะของมัน สิ่งนี้จะลดขนาดของชุดข้อมูลทั่วไป การเชื่อมโยงทั่วไปที่เป็นผลลัพธ์สามารถแมปเป็นหลายรูปแบบเพื่อนำเสนอต่อผู้ใช้ รวมถึงแผนภูมิหรือกฎ

กระบวนการของการเหนี่ยวนำเชิงคุณลักษณะซึ่งมีดังต่อไปนี้ −

  • ขั้นแรก ต้องใช้การโฟกัสข้อมูลก่อนการเหนี่ยวนำเชิงแอตทริบิวต์ ขั้นตอนนี้สอดคล้องกับคำอธิบายของเรกคอร์ดที่เกี่ยวข้องกับงาน (เช่น ข้อมูลสำหรับการวิเคราะห์) ข้อมูลจะถูกรวบรวมตามข้อมูลที่รองรับในแบบสอบถามการทำเหมืองข้อมูล

  • เนื่องจากคิวรีการทำเหมืองข้อมูลมักจะเกี่ยวข้องกับส่วนหนึ่งของฐานข้อมูลเท่านั้น การเลือกชุดข้อมูลที่เกี่ยวข้องไม่เพียงทำให้การขุดมีประสิทธิภาพมากขึ้น แต่ยังเปลี่ยนผลลัพธ์ที่สำคัญกว่าการขุดฐานข้อมูลทั้งหมดด้วย

  • การระบุชุดของแอตทริบิวต์ที่เกี่ยวข้อง (เช่น คุณลักษณะสำหรับการขุด ตามที่ระบุไว้ใน DMQL โดยมีความเกี่ยวข้องกับอนุประโยค) อาจเป็นเรื่องยากสำหรับผู้ใช้ ผู้ใช้สามารถเลือกแอตทริบิวต์บางอย่างที่มีความสำคัญ ในขณะที่ขาดแอตทริบิวต์อื่นๆ ที่สามารถมีบทบาทในการนำเสนอได้

  • ตัวอย่างเช่น สมมติว่าสถานที่เกิดของมิติข้อมูลถูกกำหนดโดยแอตทริบิวต์ เมือง จังหวัด หรือ รัฐ และประเทศ มันสามารถทำให้เกิดลักษณะทั่วไปในมิติสถานที่เกิด ควรรวมแอตทริบิวต์อื่นๆ ที่กำหนดมิตินี้ไว้ด้วย

  • ในอีกแง่หนึ่ง การให้ระบบเกี่ยวข้องกับจังหวัดหรือรัฐและประเทศโดยอัตโนมัติ เนื่องจากคุณลักษณะที่เกี่ยวข้องทำให้เมืองสามารถถูกทำให้เป็นภาพรวมในระดับแนวความคิดที่ใหญ่ขึ้นเหล่านี้ได้ในระหว่างขั้นตอนการปฐมนิเทศ

  • ในอีกทางหนึ่ง สมมติว่าผู้ใช้อาจใส่แอตทริบิวต์มากเกินไปโดยการระบุแอตทริบิวต์ที่เป็นไปได้ทั้งหมดด้วยส่วนคำสั่ง "ที่เกี่ยวข้องกับ *" ในกรณีนี้ คุณลักษณะทั้งหมดในความสัมพันธ์ที่ระบุโดยอนุประโยคจากจะรวมอยู่ในการวิเคราะห์

  • คุณลักษณะบางอย่างไม่น่าจะมีส่วนทำให้เกิดการนำเสนอที่น่าสนใจ สามารถใช้วิธีการวิเคราะห์แบบอิงสหสัมพันธ์หรือเอนโทรปีเพื่อทำการวิเคราะห์ความเกี่ยวข้องของแอตทริบิวต์และกรองแอตทริบิวต์ที่ไม่เกี่ยวข้องทางสถิติหรือแอตทริบิวต์ที่เกี่ยวข้องเล็กน้อยออกจากกระบวนการขุดแบบพรรณนา