Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การออกแบบคลังข้อมูลที่ขับเคลื่อนด้วยคุณภาพคืออะไร?


คลังข้อมูลกำหนดฐานข้อมูลที่ได้รับการดูแลอย่างเป็นอิสระจากฐานข้อมูลการดำเนินงานขององค์กร ระบบคลังข้อมูลช่วยให้สามารถผสานรวมระบบแอปพลิเคชันต่างๆ ได้ รองรับการประมวลผลข้อมูลโดยรองรับแพลตฟอร์มที่แข็งแกร่งของบันทึกประวัติที่รวมไว้สำหรับการวิเคราะห์

คลังข้อมูลสามารถดูเป็นชุดของมุมมองที่เป็นรูปธรรมซึ่งแสดงผ่านความสัมพันธ์ฐานระยะไกล เมื่อคิวรีเป็นทางการ เคียวรีจะถูกคำนวณในเครื่อง โดยใช้มุมมองที่เป็นรูปธรรม โดยไม่ต้องเข้าถึงแหล่งข้อมูลเริ่มต้น

คลังข้อมูลเป็นเอนทิตีที่ทำงานอยู่ซึ่งได้รับมาอย่างต่อเนื่องเมื่อเวลาผ่านไป เมื่อเวลาผ่านไปคำถามใหม่จะต้องได้รับคำตอบจากพวกเขา สามารถตอบคำถามต่างๆ ได้โดยใช้มุมมองที่เป็นรูปธรรมเท่านั้น โดยทั่วไป แม้ว่าจะต้องใส่มุมมองใหม่ลงในคลังข้อมูล

หลังจากที่โครงสร้างพื้นฐานในการประมวลผลธุรกรรมออนไลน์ขั้นพื้นฐาน (OLTP) ได้ถูกนำมาใช้ในบางองค์กร ไม่ใช่ที่เล็กที่สุดผ่านเครื่องมือการวางแผนทรัพยากรขององค์กรที่ได้มาตรฐาน ซึ่งรวมถึง SAP/ R3 เป้าหมายที่น่าสนใจได้ขยายออกไปอย่างน้อยสามทิศทาง -

  • แหล่งข้อมูลมัลติมีเดียที่หลากหลายทั้งภายในและภายนอกองค์กร

  • ลูกค้าที่หลากหลายขึ้นด้วยโปรไฟล์ความสนใจและความสามารถที่หลากหลายและพารามิเตอร์ของสถานการณ์

  • การแปลงข้อมูลประสบการณ์ขนาดใหญ่ที่เกิดจากการประมวลผลธุรกรรมเป็นความรู้ที่ใช้กับข้อมูลองค์กรและการดำเนินการ

มีการเสนอสถาปัตยกรรมลอจิสติกส์การไหลของข้อมูลที่หลากหลายภายใต้ฉลาก ซึ่งรวมถึงการจัดการห่วงโซ่อุปทานและอีคอมเมิร์ซระหว่างธุรกิจกับธุรกิจ ในสถาปัตยกรรมดังกล่าว ฐานข้อมูลสามารถใช้เป็นที่เก็บข้อมูลระยะกลางในระยะสั้นและระยะกลาง ในขณะที่คลังข้อมูลใช้สำหรับหน่วยความจำระยะยาว การสร้างความรู้ และการจัดการ

ระบบคลังข้อมูลประกอบด้วยฐานข้อมูล (ฐานข้อมูลต้นทาง มุมมองที่เป็นรูปธรรมในคลังข้อมูล) ตัวแทนการขนส่งข้อมูลที่จัดส่งบันทึกจากฐานข้อมูลหนึ่งไปยังอีกฐานข้อมูลหนึ่ง และพื้นที่เก็บข้อมูลที่บันทึกข้อมูลเมตาเกี่ยวกับระบบและการขยาย

ในสถาปัตยกรรมนี้ แหล่งข้อมูลที่ต่างกันจะถูกสร้างขึ้นครั้งแรกในวิธีการแบบเดียวกันผ่านกลไกการแยกที่เรียกว่า wrappers จากนั้นผู้ไกล่เกลี่ยจะใช้บริการของการรวมข้อมูลและการแก้ไขข้อขัดแย้ง การแยกตัวระหว่าง wrappers และตัวกลางเป็นการตัดสินใจในการออกแบบ ซึ่งสะท้อนถึงการแยกระหว่าง service wrappers และตัวรับคำร้องในระบบมิดเดิลแวร์รวมถึง CORBA

ผลลัพธ์ที่ได้มาตรฐานและเร็กคอร์ดแบบรวมจะถูกบันทึกเป็นมุมมองที่เป็นรูปธรรมในคลังข้อมูล มุมมองพื้นฐานเหล่านี้โดยทั่วไปแล้วจะรวมกันเล็กน้อย มันสามารถปรับแต่งให้เหมาะกับผู้ใช้นักวิเคราะห์หลายคน data marts ที่มีข้อมูลที่รวบรวมมากขึ้นเกี่ยวกับพื้นที่เฉพาะที่น่าสนใจถูกสร้างขึ้นเป็นแคชระดับที่สองซึ่งจะถูกแทรกซึมโดยเครื่องมือวิเคราะห์ข้อมูลตั้งแต่สิ่งอำนวยความสะดวกในการสืบค้นผ่านเครื่องมือสเปรดชีตไปจนถึงระบบการทำเหมืองข้อมูลที่เต็มเปี่ยม