Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

โครงสร้างสำหรับการขุดวิเคราะห์แบบออนไลน์คืออะไร?


เซิร์ฟเวอร์ OLAM ทำการขุดเชิงวิเคราะห์ใน data cube คล้ายกับเซิร์ฟเวอร์ OLAP ที่ทำการประมวลผลเชิงวิเคราะห์ออนไลน์ กลไก OLAM และ OLAP แบบบูรณาการ โดยที่ทั้งเซิร์ฟเวอร์ OLAM และ OLAP ยอมรับการสืบค้นออนไลน์ของผู้ใช้ (หรือคำสั่ง) ผ่าน API ส่วนต่อประสานกราฟิกกับผู้ใช้ และทำงานกับ data cube ในการวิเคราะห์ข้อมูลผ่าน cube API

สามารถใช้ไดเร็กทอรี metadata เพื่อสั่งการเข้าถึง data cube ดาต้าคิวบ์สามารถสร้างขึ้นได้โดยการเข้าถึงและรวมฐานข้อมูลหลาย ๆ ฐานข้อมูลผ่าน MDDB API และโดยการกรองคลังข้อมูลผ่าน API ฐานข้อมูลที่สามารถให้การเชื่อมต่อ OLE DB หรือ ODBC

เนื่องจากเซิร์ฟเวอร์ OLAM สามารถทำงานการทำเหมืองข้อมูลได้หลายอย่าง รวมถึงคำอธิบายแนวคิด การเชื่อมโยง การจำแนกประเภท การทำนาย การจัดกลุ่ม การวิเคราะห์อนุกรมเวลา ฯลฯ โดยทั่วไปจะมีโมดูลการขุดข้อมูลแบบบูรณาการหลายโมดูลและมีความซับซ้อนสูงกว่าเซิร์ฟเวอร์ OLAP

กลไก OLAM สามารถทำงานการทำเหมืองข้อมูลได้หลายงาน เช่น คำอธิบายแนวคิด การเชื่อมโยง การจำแนกประเภท การทำนาย การจัดกลุ่ม และการวิเคราะห์อนุกรมเวลา ดังนั้นจึงมักประกอบด้วยโมดูลการทำเหมืองข้อมูลแบบบูรณาการหลายโมดูล ทำให้มีความซับซ้อนมากกว่าเอ็นจิ้น OLAP ไม่มีความแตกต่างพื้นฐานระหว่าง data cube ที่จำเป็นสำหรับ OLAP และสำหรับ OLAM แม้ว่าการวิเคราะห์ OLAM อาจต้องการการสร้าง data cube และเครื่องมือการเข้าถึงที่มีประสิทธิภาพมากขึ้น

นี่เป็นกรณีที่ OLAM เกี่ยวข้องกับมิติที่มากขึ้นด้วยความละเอียดที่ละเอียดกว่า หรือเกี่ยวข้องกับการสำรวจที่ขับเคลื่อนด้วยการค้นพบของการรวมหลายฟีเจอร์บน data cube จึงต้องการมากกว่าการวิเคราะห์ OLAP นอกจากนี้ เมื่อการขุดข้อมูลเชิงสำรวจระบุจุดที่น่าสนใจ เครื่องมือ OLAM อาจจำเป็นต้องเจาะลึกจาก data cube ลงในฐานข้อมูลเชิงสัมพันธ์ที่สอดคล้องกันสำหรับการวิเคราะห์โดยละเอียดของข้อมูลบางส่วนโดยเฉพาะ

นี่เป็นกรณีที่ OLAM เกี่ยวข้องกับมิติที่มากขึ้นด้วยความละเอียดที่ละเอียดกว่า หรือเกี่ยวข้องกับการสำรวจที่ขับเคลื่อนด้วยการค้นพบของการรวมหลายฟีเจอร์บน data cube จึงต้องการมากกว่าการวิเคราะห์ OLAP นอกจากนี้ เมื่อการขุดข้อมูลเชิงสำรวจระบุจุดที่น่าสนใจ เครื่องมือ OLAM อาจจำเป็นต้องเจาะลึกจาก data cube ลงในฐานข้อมูลเชิงสัมพันธ์ที่สอดคล้องกันสำหรับการวิเคราะห์โดยละเอียดของข้อมูลบางส่วนโดยเฉพาะ

นอกจากนี้ กระบวนการขุดข้อมูลสามารถเปิดเผยว่าขนาดหรือการวัดของคิวบ์ที่สร้างขึ้นไม่เหมาะสำหรับการวิเคราะห์ข้อมูล ที่นี่ การออกแบบ data cube ที่ปรับปรุงแล้วสามารถปรับปรุงคุณภาพของการสร้างคลังข้อมูลได้

การทำเหมืองข้อมูลที่มีประสิทธิภาพต้องใช้การวิเคราะห์ข้อมูลเชิงสำรวจ ผู้ใช้มักต้องการสำรวจผ่านฐานข้อมูล เลือกส่วนของข้อมูลที่เกี่ยวข้อง วิเคราะห์ข้อมูลตามรายละเอียดต่างๆ และนำเสนอความรู้/ผลลัพธ์ในรูปแบบต่างๆ

การทำเหมืองข้อมูลเชิงวิเคราะห์ออนไลน์มีสิ่งอำนวยความสะดวกสำหรับการทำเหมืองข้อมูลในชุดย่อยต่างๆ ของข้อมูลและในระดับต่างๆ ของสิ่งที่เป็นนามธรรม สามารถทำได้โดยการเจาะลึก การหมุน กรอง การแยก และการแบ่งบน data cube และผลลัพธ์การทำเหมืองข้อมูลระดับกลาง เมื่อใช้ร่วมกับเครื่องมือสร้างภาพข้อมูล/ความรู้ จะช่วยเพิ่มพลังและความสามารถในการปรับตัวของการขุดข้อมูลเชิงสำรวจได้อย่างมาก