Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การทำเหมืองข้อมูลเกี่ยวข้องกับการประมวลผลข้อมูลและการประมวลผลการวิเคราะห์ออนไลน์อย่างไร


แอปพลิเคชันคลังข้อมูลมีสามประเภท เช่น การประมวลผลข้อมูล การประมวลผลเชิงวิเคราะห์ และการทำเหมืองข้อมูล

การประมวลผลข้อมูล − ให้การสืบค้น การวิเคราะห์เชิงตัวเลขเบื้องต้น และการจัดทำเอกสารโดยใช้ตารางไขว้ ตาราง แผนภูมิ หรือกราฟ แนวโน้มสมัยใหม่ในการประมวลผลข้อมูลของคลังข้อมูลคือการสร้างเครื่องมือเข้าถึงบนเว็บราคาประหยัดที่รวมเข้ากับเว็บเบราว์เซอร์

การประมวลผลเชิงวิเคราะห์ − มีการดำเนินการ OLAP พื้นฐาน เช่น การแบ่งส่วนและลูกเต๋า การเจาะลึก การโรลอัพ และการหมุน มักใช้กับข้อมูลทางประวัติศาสตร์ทั้งในรูปแบบสรุปและรายละเอียด พื้นที่หลักของการประมวลผลเชิงวิเคราะห์ออนไลน์เหนือการประมวลผลข้อมูลคือการวิเคราะห์ข้อมูลหลายมิติของข้อมูลคลังข้อมูล

การขุดข้อมูล − ให้การค้นพบความรู้โดยการค้นพบรูปแบบและการเชื่อมโยงที่ซ่อนอยู่ การสร้างแบบจำลองการวิเคราะห์ การจัดประเภทและการทำนาย และแสดงผลการขุดโดยใช้เครื่องมือสร้างภาพ

การประมวลผลข้อมูลขึ้นอยู่กับการสืบค้น สามารถค้นพบข้อมูลที่เป็นประโยชน์ มันสามารถตอบคำถามดังกล่าวสะท้อนข้อมูลที่บันทึกไว้โดยตรงในฐานข้อมูลหรือคำนวณได้โดยบริการรวม สิ่งเหล่านี้ไม่ได้สะท้อนถึงการออกแบบที่ซับซ้อนหรือความสามารถในการคาดการณ์ที่ฝังอยู่ในฐานข้อมูล ดังนั้น การประมวลผลข้อมูลจึงไม่ใช่การทำเหมืองข้อมูล

การประมวลผลเชิงวิเคราะห์ออนไลน์นั้นเข้าใกล้การทำเหมืองข้อมูลมากขึ้น เนื่องจากสามารถเปลี่ยนข้อมูลที่สรุปได้ในหลายระดับจากชุดย่อยที่ผู้ใช้กำหนดเองของคลังข้อมูล บริการของ OLAP และการทำเหมืองข้อมูลถือได้ว่าไม่เกี่ยวข้องกัน -

OLAP เป็นเครื่องมือสรุป/รวบรวมข้อมูลที่รองรับการวิเคราะห์ข้อมูลได้อย่างง่ายดาย ในขณะที่การทำเหมืองข้อมูลช่วยให้ค้นพบการออกแบบโดยปริยายและความรู้ที่น่าสนใจที่ซ่อนอยู่ในข้อมูลจำนวนมหาศาลโดยอัตโนมัติ

เครื่องมือ OLAP มีเป้าหมายเพื่อลดความซับซ้อนและให้การวิเคราะห์ข้อมูลเชิงโต้ตอบ ในขณะที่วัตถุประสงค์ของเครื่องมือการขุดข้อมูลคือการทำให้กระบวนการเป็นไปโดยอัตโนมัติตามความเหมาะสม ในขณะที่ทำให้ผู้ใช้สนับสนุนกระบวนการได้ ในวิธีนี้ การทำเหมืองข้อมูลจะก้าวไปอีกขั้นหนึ่งของการประมวลผลเชิงวิเคราะห์ออนไลน์แบบเดิม

สามารถใช้มุมมองทางเลือกของการทำเหมืองข้อมูลซึ่งการทำเหมืองข้อมูลครอบคลุมทั้งการกำหนดข้อมูลและการสร้างแบบจำลองข้อมูล เนื่องจากระบบ OLAP สามารถแสดงคำจำกัดความทั่วไปของข้อมูลจากคลังข้อมูล บริการ OLAP จึงจำเป็นสำหรับการสรุปและการเปรียบเทียบข้อมูลที่ผู้ใช้กำหนด (โดยการเจาะลึก การหมุน การแบ่งส่วน การแบ่งส่วน ฯลฯ)

การทำเหมืองข้อมูลไม่ได้จำกัดอยู่เพียงการวิเคราะห์ข้อมูลที่บันทึกไว้ในคลังข้อมูล สามารถสำรวจข้อมูลที่มีอยู่ในรายละเอียดที่ละเอียดกว่าบันทึกสรุปที่รองรับในคลังข้อมูล

นอกจากนี้ยังสามารถสำรวจระเบียนธุรกรรม เชิงพื้นที่ ข้อความ และมัลติมีเดียที่ซับซ้อนเพื่อสร้างแบบจำลองด้วยเทคโนโลยีฐานข้อมูลหลายมิติที่ทันสมัย ในบริบทนี้ การทำเหมืองข้อมูลครอบคลุมช่วงความถี่ที่กว้างกว่า OLAP ที่เกี่ยวข้องกับบริการการทำเหมืองข้อมูลและความซับซ้อนของข้อมูลที่จัดการ