Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

Data Cube คืออะไร?


ดาต้าคิวบ์ช่วยให้สามารถสร้างโมเดลและดูข้อมูลได้ในหลายมิติ มันถูกแสดงด้วยมิติและข้อเท็จจริง กล่าวอีกนัยหนึ่ง มิติคือมุมมองหรือเอนทิตีที่เกี่ยวข้องกับที่องค์กรจำเป็นต้องเก็บบันทึก

ตัวอย่างเช่น AllElectronics สามารถสร้างคลังข้อมูลการขายเพื่อรักษาเรกคอร์ดของเวลา รายการ สาขา และสถานที่ที่เกี่ยวข้องกับการขายของร้านค้า มิติข้อมูลเหล่านี้ช่วยให้ร้านค้าสามารถติดตามสิ่งต่าง ๆ เช่นยอดขายรายเดือนของสินค้าและสาขาและที่ตั้งที่ขายสินค้าได้

แต่ละมิติสามารถมีตารางที่เกี่ยวข้องกันได้ เรียกว่าตารางมิติซึ่งแสดงถึงมิติต่อไป ตัวอย่างเช่น ตารางมิติข้อมูลสำหรับสินค้าสามารถรวมแอตทริบิวต์ชื่อสินค้า ยี่ห้อ และประเภท ผู้ใช้หรือผู้เชี่ยวชาญกำหนดตารางไดเมนชันได้ หรือสร้างและปรับเปลี่ยนโดยอัตโนมัติตามการกระจายข้อมูล

โดยทั่วไป โมเดลข้อมูลหลายมิติจะถูกจัดระเบียบรอบๆ การออกแบบส่วนกลาง เช่น การขาย เป็นต้น การออกแบบนี้กำหนดโดยตารางข้อเท็จจริง ข้อเท็จจริงคือการวัดทางคณิตศาสตร์ ตัวอย่างของข้อเท็จจริงสำหรับคลังข้อมูลการขายประกอบด้วยดอลลาร์ที่ขาย (ยอดขายเป็นดอลลาร์) หน่วยที่ขาย (จำนวนหน่วยที่ขาย) และจำนวนเงินที่จัดทำงบประมาณ ตารางข้อเท็จจริงประกอบด้วยชื่อของข้อเท็จจริงหรือหน่วยวัด และคีย์ของตารางไดเมนชันที่เกี่ยวข้องแต่ละตาราง

data cube ถูกสร้างขึ้นจากชุดย่อยของแอ็ตทริบิวต์ในฐานข้อมูล แอตทริบิวต์เฉพาะจะถูกเลือกให้เป็นแอตทริบิวต์การวัด กล่าวคือ คุณลักษณะที่มีค่าที่น่าสนใจ แอตทริบิวต์อื่นๆ จะถูกเลือกเป็นมิติข้อมูลหรือแอตทริบิวต์การทำงาน แอตทริบิวต์การวัดจะถูกรวมตามมิติข้อมูล

ตัวอย่างเช่น XYZ สามารถสร้างคลังข้อมูลการขายเพื่อเก็บรักษาบันทึกการขายของร้านค้าสำหรับเวลา รายการ สาขา และสถานที่ตั้งของมิติ มิติข้อมูลเหล่านี้ช่วยให้ร้านค้าสามารถติดตามสิ่งต่างๆ เช่น ยอดขายรายเดือนของสินค้า สาขาและตำแหน่งที่ขายสินค้าได้

แต่ละมิติสามารถมีตารางที่รับรู้ได้ เรียกว่าตารางมิติซึ่งกำหนดมิติ ตัวอย่างเช่น ตารางมิติข้อมูลสำหรับรายการสามารถรวมแอตทริบิวต์ item_name แบรนด์ และประเภทได้

เทคนิคดาต้าคิวบ์เป็นวิธีที่น่าสนใจด้วยการใช้งานที่หลากหลาย คิวบ์ข้อมูลสามารถกระจัดกระจายได้ในบางกรณี เนื่องจากไม่ใช่ทุกเซลล์ในแต่ละมิติจะมีข้อมูลที่สอดคล้องกันในฐานข้อมูล หากการสืบค้นมีค่าคงที่ในระดับที่ต่ำกว่าที่รองรับใน data cube จะไม่ชัดเจนว่าจะพัฒนาการใช้ผลลัพธ์ที่คำนวณล่วงหน้าได้ดีที่สุดที่บันทึกไว้ใน data cube ได้อย่างไร