Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ตัวอย่างของ data generalization และ analytical generalization คืออะไร?


ข้อมูลทั่วไปสรุปข้อมูลโดยแทนที่ค่าที่ค่อนข้างต่ำ (รวมถึงค่าตัวเลขสำหรับอายุแอตทริบิวต์) ด้วยแนวคิดระดับสูง (รวมถึงอายุน้อย วัยกลางคน และอาวุโส) ดังนั้นจึงเป็นกระบวนการที่สรุปชุดข้อมูลที่เกี่ยวข้องกับงานจำนวนมากในฐานข้อมูลจากระดับแนวคิดที่ค่อนข้างต่ำไปจนถึงระดับแนวคิดที่สูงขึ้น

ต่อไปนี้คือสองวิธีในการทำให้ชุดข้อมูลขนาดใหญ่มีภาพรวมที่มีประสิทธิภาพและยืดหยุ่นได้ -

แนวทาง OLAP − เทคโนโลยีดาต้าคิวบ์สามารถถือเป็นแนวทางการดูแบบเป็นรูปธรรมที่อิงตามคลังข้อมูล เน้นการคำนวณล่วงหน้า ใช้การรวมออฟไลน์ก่อนหน้านี้ OLAP หรือแบบสอบถามการทำเหมืองข้อมูลจะถูกย้ายสำหรับการประมวลผล

วิธีการเหนี่ยวนำเชิงแอตทริบิวต์ − เป็นแนวทางการวิเคราะห์ข้อมูลออนไลน์ที่เน้นการสืบค้นฐานข้อมูลเชิงสัมพันธ์ ในการเหนี่ยวนำเชิงแอตทริบิวต์ อันดับแรก ข้อมูลที่เกี่ยวข้องกับงานจะถูกรวบรวมโดยใช้การสืบค้นฐานข้อมูลเชิงสัมพันธ์ จากนั้นจึงใช้การวางนัยทั่วไปตามการตรวจสอบค่าที่แตกต่างกันหลายค่าของแต่ละแอตทริบิวต์ในการรวบรวมข้อมูลที่เกี่ยวข้อง

ลักษณะทั่วไปถูกนำไปใช้โดยการลบแอตทริบิวต์ การรวม tuples ทั่วไปที่เหมือนกันและการสะสมจำนวนตามลำดับทำให้เกิดการรวม การลดขนาดของชุดข้อมูลทั่วไปและการนำเสนอแบบโต้ตอบกับผู้ใช้

หลักการพื้นฐานของวิธีการเหนี่ยวนำเชิงแอตทริบิวต์ -

  • การเน้นข้อมูล − ข้อมูลจะต้องเกี่ยวข้องกับงาน เช่น มิติ และผลลัพธ์คือความสัมพันธ์ดั้งเดิม
  • แอตทริบิวต์-การลบ − สามารถเลือกชุดของแอตทริบิวต์ที่เกี่ยวข้องหรือลบแอตทริบิวต์ A ได้หากมีชุดค่าเฉพาะจำนวนมากสำหรับ A แต่ไม่มีตัวดำเนินการการวางนัยทั่วไปใน A หรือแนวคิดระดับสูงกว่าของ A กำหนดไว้ในแง่ของแอตทริบิวต์เพิ่มเติม
  • ลักษณะทั่วไปของแอตทริบิวต์ − หากมีชุดค่าที่แตกต่างกันจำนวนมากสำหรับ A และมีชุดของตัวดำเนินการการวางนัยทั่วไปใน A ให้เลือกตัวดำเนินการและกำหนด A
  • การกำหนดลักษณะการวิเคราะห์ − เป็นวิธีการทางสถิติสำหรับการประมวลผลข้อมูลล่วงหน้าเพื่อกรองแอตทริบิวต์ที่ไม่เกี่ยวข้องหรือจัดอันดับแอตทริบิวต์ที่เกี่ยวข้อง การวัดผลการวิเคราะห์ความเกี่ยวข้องของแอตทริบิวต์สามารถใช้เพื่อวิเคราะห์คุณลักษณะที่ไม่เกี่ยวข้องซึ่งสามารถไม่ได้รับอนุญาตจากขั้นตอนคำอธิบายแนวคิด การรวมขั้นตอนก่อนการประมวลผลนี้เข้าไปในการกำหนดลักษณะหรือการเปรียบเทียบของคลาสถูกกำหนดให้เป็นคุณลักษณะเชิงวิเคราะห์

เหตุผลในการวิเคราะห์ความเกี่ยวข้องของแอตทริบิวต์

มีเหตุผลหลายประการสำหรับการวิเคราะห์ความเกี่ยวข้องของแอตทริบิวต์มีดังนี้ -

  • สามารถกำหนดขนาดที่ควรรวมได้

  • สามารถบรรลุภาพรวมในระดับสูงได้

  • สามารถลดจำนวนแอตทริบิวต์ที่ช่วยให้เราเข้าใจรูปแบบได้ง่าย

แนวคิดพื้นฐานที่อยู่เบื้องหลังการวิเคราะห์ความเกี่ยวข้องของแอตทริบิวต์คือการประเมินการวัดที่สามารถคำนวณความเกี่ยวข้องของแอตทริบิวต์ที่เกี่ยวกับคลาสหรือวิธีการที่กำหนด มาตรการดังกล่าวเกี่ยวข้องกับข้อมูลที่ได้มา ความคลุมเครือ และค่าสัมประสิทธิ์สหสัมพันธ์