การรวมคิวบ์ข้อมูลคืออะไร

การรวมข้อมูลเป็นขั้นตอนของการผสานข้อมูลจากแหล่งที่แตกต่างกันหลายแห่ง ขณะทำการรวมข้อมูล จะต้องทำงานบน data redundancy, inconsistency, duplicity ฯลฯ ในการทำ data mining การรวมข้อมูลเป็นวิธีการเตรียมบันทึกที่รวมข้อมูลจากแหล่งข้อมูลที่ต่างกันสองแห่งเป็นข้อมูลที่เชื่อมโยงกันเพื่อเก็บรักษาและจัดเตรียมให้เป็นหนึ่งเดียว มุมมองของข้อมูล

การรวมข้อมูลมีความสำคัญอย่างยิ่งในอุตสาหกรรมการดูแลสุขภาพ ข้อมูลแบบบูรณาการจากบันทึกผู้ป่วยและคลินิกหลายแห่งช่วยแพทย์ในการระบุความผิดปกติทางการแพทย์และโรคต่างๆ โดยการผสานข้อมูลจากหลายระบบไว้ในมุมมองเดียวของข้อมูลที่เป็นประโยชน์ซึ่งจะได้รับข้อมูลเชิงลึกที่เป็นประโยชน์

การรวบรวมและการรวมข้อมูลอย่างมีประสิทธิภาพยังช่วยปรับปรุงความถูกต้องของการประมวลผลการเรียกร้องค่ารักษาพยาบาล และทำให้แน่ใจว่าชื่อผู้ป่วยและข้อมูลติดต่อได้รับการบันทึกอย่างสม่ำเสมอและถูกต้อง การทำงานร่วมกันหมายถึงการแบ่งปันข้อมูลข้ามระบบต่างๆ

เมื่อเรามีข้อมูลในรูปแบบที่แตกต่างจากที่จำเป็น แล้ววิธีการรวมก็สามารถนำไปใช้กับแอตทริบิวต์เพื่อให้ได้แอตทริบิวต์ที่ต้องการ ตัวอย่างเช่น ร้านค้ามีข้อมูลประกอบด้วยยอดขายรายไตรมาสสำหรับปี 2010 ถึง 2012 ข้อมูลมีอยู่ในแบบฟอร์มรายไตรมาส แต่จำเป็นต้องเรียกข้อมูลยอดขายประจำปี จึงต้องรวบรวมข้อมูลเพื่อค้นหาผลลัพธ์ที่ต้องการ

ไตรมาส	ยอดขาย	ไตรมาส	ยอดขาย	ไตรมาส	ยอดขาย	ปี	ยอดขาย
ปี 2553		ปี 2554		ปี 2555		ยอดขายปี
ไตรมาสที่ 1	10,000 บาท	ไตรมาสที่ 1	8,000 บาท	ไตรมาสที่ 1	15,000 รูปี	2010	Rs.1,30,000
ไตรมาสที่ 2	50000 รูปี	ไตรมาสที่ 2	15,000 รูปี	ไตรมาสที่ 2	20,000 บาท	2011	53000 บาท
ไตรมาสที่ 3	40000 รูปี	ไตรมาสที่ 3	10,000 บาท	ไตรมาสที่ 3	40000 รูปี	2012	Rs.1,05,000
ไตรมาสที่ 4	30,000 บาท	ไตรมาสที่ 4	20,000 บาท	ไตรมาสที่ 4	30,000 บาท

ยอดขายต่อไตรมาสตั้งแต่ปี 2010 ถึง 2012 รวมเป็นสถิติยอดขายประจำปีเดียว

ลำดับชั้นของแนวคิดอาจมีอยู่สำหรับแต่ละคุณลักษณะ ทำให้สามารถวิเคราะห์ข้อมูลได้หลายระดับของนามธรรม ตัวอย่างเช่น ลำดับชั้นสำหรับสาขาอาจอนุญาตให้มีการจัดกลุ่มสาขาตามภูมิภาคตามที่อยู่ คิวบ์ข้อมูลสนับสนุนการเข้าถึงอย่างรวดเร็วไปยังข้อมูลที่สรุปไว้ล่วงหน้าและคำนวณล่วงหน้า ซึ่งเป็นประโยชน์ต่อการประมวลผลเชิงวิเคราะห์ออนไลน์และการขุดข้อมูล

ลูกบาศก์ที่สร้างขึ้นในระดับต่ำสุดของนามธรรมถูกกำหนดให้เป็นทรงลูกบาศก์ฐาน ฐานทรงลูกบาศก์ควรสอดคล้องกับเอนทิตีเดียวที่น่าสนใจ รวมทั้งการขายหรือลูกค้า กล่าวอีกนัยหนึ่ง ระดับต่ำสุดต้องใช้งานได้ หรือเป็นประโยชน์สำหรับการวิเคราะห์ ลูกบาศก์ที่ระดับสูงสุดของนามธรรมคือลูกบาศก์ยอด

ดาต้าคิวบ์ที่สร้างขึ้นสำหรับนามธรรมหลายระดับถูกกำหนดเป็นคิวบอยด์ ดังนั้นดาต้าคิวบ์จึงสามารถกำหนดแลตทิซของทรงลูกบาศก์ได้ ระดับนามธรรมที่ใหญ่ขึ้นแต่ละระดับจะลดขนาดข้อมูลผลลัพธ์ลงอีก เมื่อตอบกลับคำขอการขุดข้อมูล ควรใช้ลูกบาศก์ที่เล็กที่สุดที่เกี่ยวข้องกับงานที่กำหนด