คลังข้อมูลเป็นแนวทางที่สามารถรวบรวมและจัดการข้อมูลจากแหล่งต่างๆ เพื่อให้ธุรกิจมีความเข้าใจอย่างลึกซึ้งทางธุรกิจที่มีความหมาย คลังข้อมูลได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับการตัดสินใจของฝ่ายบริหาร
กล่าวอย่างง่าย ๆ คลังข้อมูลกำหนดฐานข้อมูลที่ได้รับการดูแลอย่างเป็นอิสระจากฐานข้อมูลการดำเนินงานขององค์กร ระบบคลังข้อมูลช่วยให้สามารถรวมระบบแอพพลิเคชั่นหลาย ๆ ตัวเข้าด้วยกันได้ พวกเขาให้การประมวลผลข้อมูลโดยนำเสนอแพลตฟอร์มที่มั่นคงของข้อมูลในอดีตที่รวมไว้สำหรับการวิเคราะห์
คลังข้อมูลทั่วไปและรวมศูนย์ข้อมูลในพื้นที่หลายมิติ การสร้างคลังข้อมูลประกอบด้วยการล้างข้อมูล การผสานรวมข้อมูล และการแปลงข้อมูล ถือเป็นขั้นตอนสำคัญก่อนการประมวลผลสำหรับการขุดข้อมูล
ให้บริการเครื่องมือประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) สำหรับการวิเคราะห์เชิงโต้ตอบของข้อมูลหลายมิติที่มีความละเอียดต่างกัน ซึ่งอำนวยความสะดวกในการสรุปข้อมูลและการทำเหมืองข้อมูลอย่างมีประสิทธิภาพ มีฟังก์ชันการขุดข้อมูลหลายอย่าง รวมถึงการเชื่อมโยง การจำแนก การทำนาย และการจัดกลุ่มเข้ากับการดำเนินการ OLAP เพื่อสร้างการขุดความรู้เชิงโต้ตอบในระดับต่างๆ ของนามธรรม
OLAP เป็นคำกว้างๆ ที่ล้อมรอบคลังข้อมูลด้วย ในรูปแบบนี้ ข้อมูลจะถูกบันทึกในรูปแบบ ซึ่งช่วยให้สามารถสร้างการทำเหมืองข้อมูล/เอกสารได้อย่างมีประสิทธิภาพ การออกแบบ OLAP ควรรองรับการจัดทำเอกสารในชุดระเบียนขนาดใหญ่โดยมีประสิทธิภาพในการปฏิบัติงานลดลงเล็กน้อย
คำที่สมบูรณ์ที่สามารถกำหนดโครงสร้างข้อมูลการรับโครงสร้างในโครงสร้าง OLTP และมีอิทธิพลต่อข้อมูลเดียวกันในโครงสร้าง OLAP คือ "การสร้างแบบจำลองมิติ" ซึ่งเป็นองค์ประกอบพื้นฐานในการสร้างคลังข้อมูล
การปรับแต่งคลังข้อมูลสามารถทำได้เพื่อปรับปรุงประสิทธิภาพ คลังข้อมูลเป็นจุดเริ่มต้นเข้าสู่ระบบ และให้โอกาสแรกในการปรับปรุงประสิทธิภาพ หากทำการตรวจสอบบนระบบคลังข้อมูล ไม่ว่าจะก่อนหรือหลังโหลดข้อมูล ก็จะส่งผลกระทบโดยตรงต่อความจุและประสิทธิภาพของระบบ
ตัวอย่างเช่น ถ้าข้อมูลเป็นบันทึกการโทร สามารถตรวจสอบได้ว่าการโทรแต่ละครั้งมีตัวระบุลูกค้าที่ถูกต้อง หากข้อมูลเป็นข้อมูลการขาย ก็สามารถตรวจสอบได้ว่าสินค้าที่ขายนั้นมีตัวระบุผลิตภัณฑ์ที่ถูกต้องหรือไม่
การโหลดข้อมูลจำนวนมากหรือดำเนินการ I/O จำนวนมาก อาจเป็นการใช้ CPU อย่างเข้มข้น เมื่อมีการตรวจสอบและการแปลงจำนวนมากที่จะนำไปใช้กับแต่ละเร็กคอร์ด ความเร็วในการโหลดสามารถปรับปรุงได้โดยใช้เทคนิคการโหลดโดยตรง นอกจากนี้ยังสามารถปรับปรุงได้โดยใช้ความเท่าเทียมกัน
มีขั้นตอนต่อไปนี้ที่ให้วิธีที่ดีที่สุดสำหรับการปรับแต่งคลังข้อมูล -
- ปรับกฎเกณฑ์ทางธุรกิจ
- ปรับแต่งการออกแบบข้อมูล
- ปรับแต่งการออกแบบแอปพลิเคชัน
- ปรับแต่งโครงสร้างตรรกะของฐานข้อมูล
- ปรับแต่งการทำงานของฐานข้อมูล
- ปรับเส้นทางการเข้าถึง
- ปรับแต่ง I/O และโครงสร้างทางกายภาพ
- ปรับแต่งการแย่งชิงทรัพยากร
- ปรับแต่งรูปแบบพื้นฐาน