Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

สถาปัตยกรรมคลังข้อมูลสามระดับคืออะไร


คลังข้อมูลมักจะมีสถาปัตยกรรม (ระดับ) สามระดับที่เกี่ยวข้องกับ -

  • ระดับล่าง เป็นเซิร์ฟเวอร์ฐานข้อมูลคลังสินค้าที่ค่อนข้างเป็นระบบฐานข้อมูลเชิงสัมพันธ์เสมอ เครื่องมือและยูทิลิตี้แบ็คเอนด์ใช้เพื่อป้อนบันทึกในระดับล่างสุดจากฐานข้อมูลการปฏิบัติงานหรือแหล่งภายนอกอื่นๆ (รวมถึงข้อมูลโปรไฟล์ผู้ใช้ที่รองรับโดยที่ปรึกษาภายนอก)

เครื่องมือและยูทิลิตี้เหล่านี้ใช้การดึงข้อมูล การล้าง และการแปลงข้อมูล (เช่น เพื่อผสานข้อมูลเดียวกันจากหลายแหล่งให้อยู่ในรูปแบบที่เป็นหนึ่งเดียว) และโหลดและรีเฟรชฟังก์ชันเพื่ออัปเดตคลังข้อมูล ข้อมูลจะถูกดึงออกมาโดยใช้อินเทอร์เฟซโปรแกรมแอปพลิเคชันที่เรียกว่าเกตเวย์

เกตเวย์ได้รับการสนับสนุนโดย DBMS พื้นฐานและอนุญาตให้โปรแกรมไคลเอ็นต์สร้างโค้ด SQL เพื่อดำเนินการที่เซิร์ฟเวอร์ ตัวอย่างของเกตเวย์เกี่ยวข้องกับ ODBC (การเชื่อมต่อฐานข้อมูลแบบเปิด) และ OLEDB (การเชื่อมโยงแบบเปิดและการฝังสำหรับฐานข้อมูล) โดย Microsoft และ JDBC (การเชื่อมต่อฐานข้อมูล Java) ระดับนี้ยังรวมถึงพื้นที่เก็บข้อมูลเมตา ซึ่งบันทึกข้อมูลเกี่ยวกับคลังข้อมูลและเนื้อหา

  • ระดับกลาง เป็นเซิร์ฟเวอร์ OLAP ที่ดำเนินการโดยทั่วไปโดยใช้โมเดล OLAP เชิงสัมพันธ์ (ROLAP) นั่นคือ DBMS เชิงสัมพันธ์แบบขยายที่แมปการดำเนินการกับข้อมูลหลายมิติกับการดำเนินการเชิงสัมพันธ์มาตรฐาน หรือโมเดล OLAP หลายมิติ (MOLAP) กล่าวคือ เซิร์ฟเวอร์วัตถุประสงค์ที่ดำเนินการข้อมูลและการดำเนินการหลายมิติโดยตรง

  • ระดับบนสุด เป็นชั้นไคลเอนต์ส่วนหน้า ประกอบด้วยเครื่องมือสืบค้นและรายงาน เครื่องมือวิเคราะห์ และ/หรือเครื่องมือขุดข้อมูล (เช่น การวิเคราะห์แนวโน้ม การคาดการณ์ ฯลฯ)

จากมุมมองของสถาปัตยกรรม มีโมเดลคลังข้อมูลสามแบบ เช่น คลังข้อมูลขององค์กร ดาต้ามาร์ท และคลังข้อมูลเสมือน

คลังสินค้าสำหรับองค์กร − คลังข้อมูลขององค์กรรวบรวมข้อมูลทั้งหมดเกี่ยวกับเรื่องที่ครอบคลุมทั้งองค์กร รองรับการรวมข้อมูลทั่วทั้งองค์กร โดยทั่วไปจะมาจากระบบปฏิบัติการอย่างน้อยหนึ่งระบบหรือผู้ให้บริการข้อมูลภายนอก และอยู่ในขอบเขตข้ามสายงาน

โดยทั่วไปจะมีข้อมูลโดยละเอียดและข้อมูลสรุป และสามารถมีขนาดตั้งแต่ไม่กี่กิกะไบต์จนถึงหลายพันกิกะไบต์ เทราไบต์ ฯลฯ คลังข้อมูลขององค์กรสามารถทำได้บนเมนเฟรมแบบดั้งเดิม คอมพิวเตอร์ซุปเปอร์เซิร์ฟเวอร์ หรือแพลตฟอร์มสถาปัตยกรรมคู่ขนาน จำเป็นต้องมีการสร้างแบบจำลองทางธุรกิจที่กว้างขวาง และอาจต้องใช้เวลาหลายปีในการออกแบบและสร้าง

ดาต้ามาร์ท − ดาต้ามาร์ทประกอบด้วยชุดย่อยของข้อมูลทั่วทั้งองค์กรซึ่งมีค่าสำหรับทีมผู้ใช้ที่แน่นอน ขอบเขตจำกัดเฉพาะวิชาที่เลือกเท่านั้น ตัวอย่างเช่น ดาต้ามาร์ทการตลาดสามารถจำกัดหัวข้อของตนไว้ที่ผู้ใช้ รายการ และการขาย ข้อมูลที่รวมอยู่ใน data marts มักจะถูกสรุป

คลังสินค้าเสมือน − คลังสินค้าเสมือนคือชุดของมุมมองเกี่ยวกับฐานข้อมูลการปฏิบัติงาน สำหรับการประมวลผลคิวรีที่มีประสิทธิภาพ เฉพาะบางมุมมองสรุปที่เป็นไปได้เท่านั้นที่สามารถทำให้เป็นจริงได้ คลังสินค้าเสมือนเป็นเพียงการสร้างแต่ต้องการความจุส่วนเกินบนเซิร์ฟเวอร์ฐานข้อมูลที่ใช้งานได้