Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

เหตุใดเราจึงต้องการคลังข้อมูลแยกต่างหาก


คลังข้อมูลเป็นเทคนิคที่ใช้เป็นหลักในการรวบรวมและจัดการข้อมูลจากแหล่งต่าง ๆ เพื่อให้ธุรกิจมีความเข้าใจอย่างลึกซึ้งทางธุรกิจที่มีความหมาย คลังข้อมูลได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับการตัดสินใจของฝ่ายบริหาร

กล่าวอย่างง่าย ๆ คลังข้อมูลหมายถึงฐานข้อมูลที่ได้รับการดูแลแยกจากฐานข้อมูลการปฏิบัติงานขององค์กร ระบบคลังข้อมูลช่วยให้สามารถรวมระบบแอปพลิเคชันต่างๆ เข้าด้วยกันได้ พวกเขาให้การประมวลผลข้อมูลโดยสนับสนุนแพลตฟอร์มที่มั่นคงของข้อมูลในอดีตที่รวมไว้สำหรับการวิเคราะห์

การสืบค้น Data Warehouse นั้นซับซ้อนเนื่องจากมีการคำนวณกลุ่มข้อมูลขนาดใหญ่ที่ระดับสรุป อาจต้องใช้การจัดระเบียบข้อมูล การเข้าถึง และเทคนิคการใช้งานที่แตกต่างกันขึ้นอยู่กับมุมมองหลายมิติ

เหตุผลหลักสำหรับการแยกกันดังกล่าวคือการช่วยเพิ่มการใช้งานทั้งสองระบบในระดับสูง ฐานข้อมูลการปฏิบัติงานถูกสร้างขึ้นและปรับแต่งจากฟังก์ชันและปริมาณงานที่รู้จัก รวมถึงการจัดทำดัชนีและการแฮชโดยใช้คีย์หลัก การค้นหาเรกคอร์ดเฉพาะ และการเพิ่มประสิทธิภาพการสืบค้น "สำเร็จรูป"

ในทางกลับกัน การสืบค้นคลังข้อมูลมักจะซับซ้อน ซึ่งรวมถึงการคำนวณกลุ่มข้อมูลขนาดใหญ่ที่ระดับสรุป และอาจต้องใช้การจัดระเบียบข้อมูล การเข้าถึง และวิธีการใช้งานเฉพาะขึ้นอยู่กับมุมมองหลายมิติ การประมวลผลการสืบค้น OLAP ในฐานข้อมูลการปฏิบัติงานจะลดประสิทธิภาพของงานปฏิบัติการลงอย่างมาก

นอกจากนี้ ฐานข้อมูลการดำเนินงานยังให้การประมวลผลหลายธุรกรรมพร้อมกัน กลไกการควบคุมและการกู้คืนพร้อมกัน รวมถึงการล็อกและการบันทึก มีความจำเป็นเพื่อให้ธุรกรรมมีความสอดคล้องและมีเสถียรภาพ แบบสอบถาม OLAP มักต้องการการเข้าถึงระเบียนข้อมูลแบบอ่านอย่างเดียวเพื่อการสรุปและการรวม

กลไกการควบคุมและการกู้คืนพร้อมกัน หากนำไปใช้กับการดำเนินการ OLAP ดังกล่าว อาจเป็นอันตรายต่อการดำเนินการของธุรกรรมที่เกิดขึ้นพร้อมกัน และทำให้ปริมาณงานของระบบ OLTP ลดลงอย่างมาก

สุดท้าย การแยกฐานข้อมูลปฏิบัติการออกจากคลังข้อมูลจะอยู่บนโครงสร้าง เนื้อหา และการใช้ข้อมูลในสองระบบนี้ การสนับสนุนการตัดสินใจจำเป็นต้องมีข้อมูลทางประวัติศาสตร์ ในขณะที่ฐานข้อมูลการปฏิบัติงานโดยทั่วไปจะไม่เก็บข้อมูลประวัติไว้

การสนับสนุนการตัดสินใจจำเป็นต้องมีการรวมเข้าด้วยกัน ซึ่งรวมถึงการรวมและการสรุปข้อมูลจากแหล่งที่แตกต่างกัน ส่งผลให้ข้อมูลมีคุณภาพสูง สะอาด และบูรณาการ ในทางตรงกันข้าม ฐานข้อมูลการปฏิบัติงานจะรวมเฉพาะข้อมูลดิบที่มีรายละเอียด ซึ่งรวมถึงธุรกรรม ซึ่งจำเป็นต้องรวบรวมก่อนการวิเคราะห์

เนื่องจากทั้งสองระบบมีฟังก์ชันการทำงานที่แตกต่างกันมากและต้องการข้อมูลประเภทต่างๆ ในปัจจุบันจึงจำเป็นต้องรักษาฐานข้อมูลแยกจากกัน อย่างไรก็ตาม มีผู้จำหน่ายระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ในการปฏิบัติงานหลายรายที่เริ่มปรับระบบดังกล่าวให้เหมาะสมเพื่อรองรับการสืบค้น OLAP ในขณะที่แนวโน้มนี้ยังคงดำเนินต่อไป การแยกระหว่างระบบ OLTP และ OLAP คาดว่าจะลดลง