Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การปรับแต่งคลังข้อมูลคืออะไร?


คลังข้อมูลเป็นแนวทางที่สามารถรวบรวมและจัดการข้อมูลจากแหล่งต่างๆ เพื่อให้ธุรกิจมีความเข้าใจอย่างลึกซึ้งทางธุรกิจที่มีความหมาย คลังข้อมูลได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับการตัดสินใจของฝ่ายบริหาร

กล่าวอย่างง่าย ๆ คลังข้อมูลกำหนดฐานข้อมูลที่ได้รับการดูแลอย่างเป็นอิสระจากฐานข้อมูลการดำเนินงานขององค์กร ระบบคลังข้อมูลช่วยให้สามารถรวมระบบแอพพลิเคชั่นหลาย ๆ ตัวเข้าด้วยกันได้ พวกเขาให้การประมวลผลข้อมูลโดยนำเสนอแพลตฟอร์มที่มั่นคงของข้อมูลในอดีตที่รวมไว้สำหรับการวิเคราะห์

คลังข้อมูลทั่วไปและรวมศูนย์ข้อมูลในพื้นที่หลายมิติ การสร้างคลังข้อมูลประกอบด้วยการล้างข้อมูล การผสานรวมข้อมูล และการแปลงข้อมูล ถือเป็นขั้นตอนสำคัญก่อนการประมวลผลสำหรับการขุดข้อมูล

ให้บริการเครื่องมือประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) สำหรับการวิเคราะห์เชิงโต้ตอบของข้อมูลหลายมิติที่มีความละเอียดต่างกัน ซึ่งอำนวยความสะดวกในการสรุปข้อมูลและการทำเหมืองข้อมูลอย่างมีประสิทธิภาพ มีฟังก์ชันการขุดข้อมูลหลายอย่าง รวมถึงการเชื่อมโยง การจำแนก การทำนาย และการจัดกลุ่มเข้ากับการดำเนินการ OLAP เพื่อสร้างการขุดความรู้เชิงโต้ตอบในระดับต่างๆ ของนามธรรม

OLAP เป็นคำกว้างๆ ที่ล้อมรอบคลังข้อมูลด้วย ในรูปแบบนี้ ข้อมูลจะถูกบันทึกในรูปแบบ ซึ่งช่วยให้สามารถสร้างการทำเหมืองข้อมูล/เอกสารได้อย่างมีประสิทธิภาพ การออกแบบ OLAP ควรรองรับการจัดทำเอกสารในชุดระเบียนขนาดใหญ่โดยมีประสิทธิภาพในการปฏิบัติงานลดลงเล็กน้อย

คำที่สมบูรณ์ที่สามารถกำหนดโครงสร้างข้อมูลการรับโครงสร้างในโครงสร้าง OLTP และมีอิทธิพลต่อข้อมูลเดียวกันในโครงสร้าง OLAP คือ "การสร้างแบบจำลองมิติ" ซึ่งเป็นองค์ประกอบพื้นฐานในการสร้างคลังข้อมูล

การปรับแต่งคลังข้อมูลสามารถทำได้เพื่อปรับปรุงประสิทธิภาพ คลังข้อมูลเป็นจุดเริ่มต้นเข้าสู่ระบบ และให้โอกาสแรกในการปรับปรุงประสิทธิภาพ หากทำการตรวจสอบบนระบบคลังข้อมูล ไม่ว่าจะก่อนหรือหลังโหลดข้อมูล ก็จะส่งผลกระทบโดยตรงต่อความจุและประสิทธิภาพของระบบ

ตัวอย่างเช่น ถ้าข้อมูลเป็นบันทึกการโทร สามารถตรวจสอบได้ว่าการโทรแต่ละครั้งมีตัวระบุลูกค้าที่ถูกต้อง หากข้อมูลเป็นข้อมูลการขาย ก็สามารถตรวจสอบได้ว่าสินค้าที่ขายนั้นมีตัวระบุผลิตภัณฑ์ที่ถูกต้องหรือไม่

การโหลดข้อมูลจำนวนมากหรือดำเนินการ I/O จำนวนมาก อาจเป็นการใช้ CPU อย่างเข้มข้น เมื่อมีการตรวจสอบและการแปลงจำนวนมากที่จะนำไปใช้กับแต่ละเร็กคอร์ด ความเร็วในการโหลดสามารถปรับปรุงได้โดยใช้เทคนิคการโหลดโดยตรง นอกจากนี้ยังสามารถปรับปรุงได้โดยใช้ความเท่าเทียมกัน

มีขั้นตอนต่อไปนี้ที่ให้วิธีที่ดีที่สุดสำหรับการปรับแต่งคลังข้อมูล -

  • ปรับกฎเกณฑ์ทางธุรกิจ
  • ปรับแต่งการออกแบบข้อมูล
  • ปรับแต่งการออกแบบแอปพลิเคชัน
  • ปรับแต่งโครงสร้างตรรกะของฐานข้อมูล
  • ปรับแต่งการทำงานของฐานข้อมูล
  • ปรับเส้นทางการเข้าถึง
  • ปรับแต่ง I/O และโครงสร้างทางกายภาพ
  • ปรับแต่งการแย่งชิงทรัพยากร
  • ปรับแต่งรูปแบบพื้นฐาน