Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ความท้าทายในการสร้างและการใช้คลังข้อมูลเชิงพื้นที่มีอะไรบ้าง?


มีปัญหาท้าทายหลายประการเกี่ยวกับการก่อสร้างและการใช้คลังข้อมูลเชิงพื้นที่ ความท้าทายแรกคือการรวมข้อมูลเชิงพื้นที่จากแหล่งและระบบที่ต่างกัน ข้อมูลเชิงพื้นที่มักจะเก็บไว้ในบริษัทอุตสาหกรรมและหน่วยงานภาครัฐต่างๆ โดยใช้รูปแบบข้อมูลที่หลากหลาย

รูปแบบข้อมูลไม่ได้เป็นเพียงโครงสร้างเฉพาะ (เช่น ข้อมูลเชิงพื้นที่แบบแรสเตอร์กับเวกเตอร์ โมเดลเชิงวัตถุเทียบกับเชิงสัมพันธ์ พื้นที่จัดเก็บเชิงพื้นที่ที่แตกต่างกันและโครงสร้างการจัดทำดัชนี) แต่ยังรวมถึงเฉพาะผู้จำหน่ายด้วย ( เช่น ESRI, MapInfo, Intergraph) มีการทำงานอย่างหนักในการรวมและแลกเปลี่ยนข้อมูลเชิงพื้นที่ที่แตกต่างกัน ซึ่งปูทางสำหรับการรวมข้อมูลเชิงพื้นที่และการสร้างคลังข้อมูลเชิงพื้นที่

ความท้าทายที่สองคือการทำให้การประมวลผลเชิงวิเคราะห์ออนไลน์รวดเร็วและยืดหยุ่นในคลังข้อมูลเชิงพื้นที่ โมเดลสคีมาแบบดาวเป็นตัวเลือกที่ดีที่สุดสำหรับการสร้างแบบจำลองคลังข้อมูลเชิงพื้นที่ เนื่องจากรองรับโครงสร้างคลังสินค้าที่รัดกุมและเป็นระเบียบ และรองรับบริการ OLAP แต่ในคลังสินค้าเชิงพื้นที่ ทั้งมิติและหน่วยวัดสามารถรวมองค์ประกอบเชิงพื้นที่ได้

มีสามประเภทของมิติในคิวบ์ข้อมูลเชิงพื้นที่ซึ่งมีดังต่อไปนี้ -

มิติที่ไม่ใช่เชิงพื้นที่ − มิติข้อมูลที่ไม่ใช่เชิงพื้นที่ประกอบด้วยข้อมูลที่ไม่ใช่เชิงพื้นที่เท่านั้น สามารถสร้างอุณหภูมิและพายุมิติที่ไม่เชิงพื้นที่สำหรับคลังสินค้าได้ ตัวอย่างเช่น เนื่องจากแต่ละรายการมีข้อมูลที่ไม่ใช่เชิงพื้นที่ซึ่งมีการสรุปเป็นไม่ใช่เชิงพื้นที่ (รวมถึง "ร้อน" สำหรับอุณหภูมิและ "เปียก" สำหรับการตกตะกอน)

มิติเชิงพื้นที่ถึงไม่เชิงพื้นที่ − มิติเชิงพื้นที่ถึงไม่เชิงพื้นที่เป็นมิติที่มีข้อมูลระดับดั้งเดิมเป็นเชิงพื้นที่แต่มีการวางนัยทั่วไปซึ่งเริ่มต้นที่ระดับสูงระดับหนึ่ง จะกลายเป็นไม่ใช่เชิงพื้นที่

มิติเชิงพื้นที่สู่มิติ − มิติเชิงพื้นที่ถึงเชิงพื้นที่คือมิติที่มีระดับดั้งเดิมและข้อมูลทั่วไประดับสูงทั้งหมดเป็นมิติเชิงพื้นที่ ตัวอย่างเช่น พื้นที่ equi _temperature ของมิติจะรวมข้อมูลเชิงพื้นที่ เช่นเดียวกับข้อมูลทั่วไปทั้งหมด รวมถึงพื้นที่ที่ครอบคลุม 0-5 องศา (เซลเซียส) 5-10 องศา เป็นต้น

มีหน่วยวัดสองประเภทในลูกบาศก์ข้อมูลเชิงพื้นที่ซึ่งมีดังต่อไปนี้ −

การวัดเชิงตัวเลข − การวัดเชิงตัวเลขประกอบด้วยข้อมูลที่เป็นตัวเลขเท่านั้น ตัวอย่างเช่น หนึ่งหน่วยวัดในคลังข้อมูลเชิงพื้นที่สามารถเป็นรายได้รายเดือนของภูมิภาค เพื่อให้การรวบรวมสามารถประเมินรายได้ทั้งหมดตามปี ตามเขต ฯลฯ การวัดเชิงตัวเลขสามารถจำแนกได้เป็นการแจกจ่าย เกี่ยวกับพีชคณิต และองค์รวม .

การวัดเชิงพื้นที่ − การวัดเชิงพื้นที่ประกอบด้วยชุดของตัวชี้ไปยังวัตถุเชิงพื้นที่ ตัวอย่างเช่น ในลักษณะทั่วไป (หรือภาพรวม) ในคิวบ์ข้อมูลเชิงพื้นที่ของภูมิภาคที่มีช่วงอุณหภูมิและการตกตะกอนเดียวกัน จะถูกจัดกลุ่มเป็นเซลล์เดียวกัน และการวัดที่เกิดขึ้นนั้นรวมถึงชุดของตัวชี้ไปยังพื้นที่เหล่านั้น

ลูกบาศก์ข้อมูลที่ไม่ใช่เชิงพื้นที่ − คิวบ์ข้อมูลที่ไม่ใช่เชิงพื้นที่รวมเฉพาะมิติที่ไม่ใช่เชิงพื้นที่และการวัดเชิงตัวเลขเท่านั้น หากคิวบ์ข้อมูลเชิงพื้นที่มีมิติเชิงพื้นที่แต่ไม่มีการวัดเชิงพื้นที่ การดำเนินการ OLAP ของคิวบ์นั้นรวมถึงการเจาะหรือการหมุนรอบ สามารถทำได้ในลักษณะที่คล้ายกับคิวบ์ข้อมูลที่ไม่ใช่เชิงพื้นที่