Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

เครื่องมือ OLAP ในการทำเหมืองข้อมูลคืออะไร?


เครื่องมือ OLAP มีสามประเภทหลักดังต่อไปนี้ -

MOLAP − MOLAP แทน OLAP หลายมิติ รองรับทูเพิลเป็นหน่วยเก็บข้อมูล MOLAP ใช้เอ็นจิ้นการจัดเก็บข้อมูลอาร์เรย์ n มิติเฉพาะและมิดเดิลแวร์ OLAP เพื่อจัดการข้อมูล ดังนั้น การสืบค้น OLAP จะเสร็จสมบูรณ์ผ่านการกำหนดแอดเดรสโดยตรงไปยังมุมมองหลายมิติที่เกี่ยวข้อง (คิวบ์ข้อมูล)

โครงสร้างนี้เน้นที่การคำนวณล่วงหน้าของข้อมูลธุรกรรมในการรวม ซึ่งส่งผลให้ประสิทธิภาพการดำเนินการแบบสอบถามรวดเร็ว โดยเฉพาะอย่างยิ่ง MOLAP จะคำนวณล่วงหน้าและจัดเก็บการวัดแบบรวมที่แต่ละระดับลำดับชั้น ณ เวลาที่โหลด และจัดเก็บและจัดทำดัชนีค่าเหล่านี้สำหรับการดึงข้อมูลในทันที

การคำนวณล่วงหน้าอย่างเต็มรูปแบบต้องใช้ค่าใช้จ่ายจำนวนมาก ทั้งในระยะเวลาดำเนินการและในพื้นที่จัดเก็บ สำหรับข้อมูลที่กระจัดกระจาย MOLAP ต้องใช้อัลกอริธึมการบีบอัดเมทริกซ์กระจัดกระจายเพื่อปรับปรุงการใช้พื้นที่จัดเก็บ ดังนั้นโดยทั่วไปแล้วจะมีการนำเสนอโดยขนาดข้อมูลบนดิสก์ที่เล็กกว่าเมื่อเปรียบเทียบกับข้อมูลที่บันทึกไว้ใน RDBMS

ผลิตภัณฑ์ที่ใช้ MOLAP จะจัดเรียง นำทาง และวิเคราะห์ข้อมูลโดยทั่วไปในรูปแบบรวม พวกเขาต้องการการเชื่อมต่อกับซอฟต์แวร์อย่างแน่นหนาและเป็นไปตามระบบฐานข้อมูลหลายมิติ (MDDB) การใช้งานที่มีประสิทธิภาพจะบันทึกข้อมูลในลักษณะที่คล้ายกับรูปแบบที่ใช้โดยใช้วิธีการจัดเก็บข้อมูลที่ได้รับการปรับปรุงเพื่อลดพื้นที่จัดเก็บ

ROLAP − ROLAP ย่อมาจาก Relational OLAP สามารถจัดเก็บข้อมูลตามเทคโนโลยี DBMS เชิงสัมพันธ์ที่คุ้นเคยอยู่แล้ว ในกรณีนี้ ข้อมูลและการรวมที่เกี่ยวข้องจะถูกบันทึกไว้ใน RDBMS และมิดเดิลแวร์ OLAP สามารถใช้การจัดการและการสำรวจคิวบ์ข้อมูลได้

สถาปัตยกรรมนี้กำหนดเป้าหมายการปรับให้เหมาะสมของส่วนหลัง RDBMS และสนับสนุนเครื่องมือและบริการเพิ่มเติมรวมถึงตรรกะการนำทางคิวบ์ข้อมูล เนื่องจากการใช้ RDBMS แบ็กเอนด์ ประโยชน์หลักของ ROLAP คือความสามารถในการปรับขนาดในการจัดการปริมาณข้อมูลขนาดใหญ่

ระบบ ROLAP ทำงานบ่อยครั้งจากข้อมูลที่ครอบครองฐานข้อมูลเชิงสัมพันธ์ ซึ่งข้อมูลพื้นฐานและตารางมิติจะถูกจัดเก็บเป็นตารางเชิงสัมพันธ์ โมเดลนี้ช่วยให้วิเคราะห์ระเบียนแบบหลายมิติได้

เป็นกลุ่มเทคโนโลยี OLAP ใหม่ล่าสุดและเติบโตเร็วที่สุดในอุตสาหกรรม วิธีนี้ช่วยให้สามารถสร้างตารางเชิงสัมพันธ์แบบสองมิติหลายมิติได้หลายมุมมอง ป้องกันไม่ให้สร้างเร็กคอร์ดรอบมุมมองที่ต้องการ

MQE − MQE ย่อมาจาก Managed Query Environment ผลิตภัณฑ์บางอย่างสามารถให้การสืบค้นข้อมูลเฉพาะกิจได้ เช่น ความสามารถในการวิเคราะห์ data cube และ slice และ dice ทำได้โดยการพัฒนาแบบสอบถามเพื่อเลือกข้อมูลจาก DBMS ซึ่งส่งข้อมูลที่ร้องขอไปยังระบบที่วางลงใน data cube

คิวบ์ข้อมูลนี้สามารถจัดเก็บไว้ในเดสก์ท็อปและจัดการที่นั่นเพื่อลดโอเวอร์เฮด จำเป็นต้องสร้างโครงสร้างทุกครั้งที่ดำเนินการสืบค้นข้อมูล หลังจากจัดเก็บข้อมูลใน data cube แล้ว การวิเคราะห์และการดำเนินการแบบหลายมิติสามารถนำมาใช้กับข้อมูลได้