Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

วิธีการทั่วไปของข้อมูลและคำอธิบายแนวคิดมีอะไรบ้าง


การวางนัยทั่วไปของข้อมูลจะสรุปข้อมูลโดยแทนที่ค่าที่ค่อนข้างต่ำ (เช่น ค่าตัวเลขสำหรับอายุแอตทริบิวต์) ด้วยแนวคิดระดับสูงกว่า (เช่น อายุน้อย วัยกลางคน และอาวุโส) เนื่องจากข้อมูลที่บันทึกไว้ในฐานข้อมูลมีปริมาณมาก จึงเป็นประโยชน์ที่จะสามารถกำหนดแนวคิดให้กระชับและรัดกุมด้วยวิธีการทั่วไป (แทนที่จะเป็นแบบต่ำ) ของนามธรรม

ช่วยให้ชุดข้อมูลมีลักษณะทั่วไปในหลายระดับของนามธรรม อำนวยความสะดวกให้ผู้ใช้ในการตรวจสอบพฤติกรรมทั่วไปของข้อมูล ตัวอย่างเช่น เมื่อพิจารณาจากฐานข้อมูล AllElectronics แทนที่จะตรวจสอบธุรกรรมของลูกค้ารายเดียว ผู้จัดการฝ่ายขายสามารถดูข้อมูลทั่วไปจนถึงระดับที่สูงกว่า ซึ่งรวมถึงสรุปโดยกลุ่มผู้ใช้ตามภูมิภาค ความถี่ในการซื้อต่อกลุ่ม และรายได้ของผู้ใช้ สิ่งนี้นำเราไปสู่แนวคิดของคำอธิบายแนวคิด ซึ่งเป็นรูปแบบของข้อมูลทั่วไป

แนวคิดโดยทั่วไปกำหนดเป็นชุดของข้อมูล ซึ่งรวมถึงผู้ซื้อบ่อย นักศึกษาระดับบัณฑิตศึกษา ฯลฯ ในฐานะที่เป็นงานเหมืองข้อมูล คำอธิบายแนวคิดไม่ใช่การแจงนับข้อมูลอย่างง่าย คำอธิบายแนวคิดจะสร้างคำอธิบายสำหรับการกำหนดลักษณะและการเปรียบเทียบข้อมูลแทน เรียกอีกอย่างว่า class description เมื่อแนวคิดกำหนดคลาสของอ็อบเจกต์

การแสดงลักษณะเฉพาะสนับสนุนการสรุปชุดข้อมูลที่กำหนดโดยกระชับและรัดกุม ในขณะที่แนวคิดหรือการเปรียบเทียบระดับชั้น (เรียกอีกอย่างว่าการเลือกปฏิบัติ) รองรับคำอธิบายที่เปรียบเทียบชุดข้อมูลสองชุดขึ้นไป มีกรณีดังต่อไปนี้ซึ่งเป็นดังต่อไปนี้ -

ประเภทข้อมูลที่ซับซ้อนและการรวม คลังข้อมูลและเครื่องมือ OLAP ขึ้นอยู่กับโมเดลข้อมูลหลายมิติที่ดูข้อมูลในรูปแบบของ data cube รวมถึงมิติ (หรือแอตทริบิวต์) และหน่วยวัด (บริการรวม)

อย่างไรก็ตาม ระบบ OLAP ในปัจจุบันหลายระบบจำกัดมิติไว้ที่ระเบียนที่ไม่ใช่ตัวเลข และวัดเป็นข้อมูลตัวเลข ฐานข้อมูลอาจเกี่ยวข้องกับคุณลักษณะของข้อมูลหลายประเภท เช่น ตัวเลข ไม่ใช่ตัวเลข เชิงพื้นที่ ข้อความ หรือรูปภาพ ซึ่งต้องเกี่ยวข้องกับคำอธิบายแนวคิด

การควบคุมของผู้ใช้กับการทำงานอัตโนมัติ − การประมวลผลเชิงวิเคราะห์ออนไลน์ในคลังข้อมูลเป็นขั้นตอนที่ผู้ใช้ควบคุม การเลือกมิติข้อมูลและซอฟต์แวร์ของบริการ OLAP ซึ่งรวมถึงการเจาะลึก โรลอัพ การแบ่งส่วน และการแบ่งส่วน มักถูกควบคุมและจัดการโดยผู้ใช้

แม้ว่าการควบคุมในระบบ OLAP หลายระบบจะใช้งานง่าย แต่ผู้ใช้ก็ต้องการความเข้าใจที่ดีที่สุดเกี่ยวกับความสำคัญของแต่ละมิติ นอกจากนี้ยังสามารถค้นหาคำอธิบายที่น่าพอใจของข้อมูล ผู้ใช้สามารถกำหนดชุดปฏิบัติการ OLAP แบบยาวได้

ขอแนะนำให้มีขั้นตอนที่เป็นอัตโนมัติมากขึ้นซึ่งสนับสนุนผู้ใช้ในการตัดสินใจว่ามิติใด (หรือแอตทริบิวต์) จะต้องรวมอยู่ในการวิเคราะห์ และระดับที่ชุดข้อมูลที่กำหนดจะต้องเป็นแบบทั่วไปเพื่อสร้างการสรุปข้อมูลที่น่าสนใจ