Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

รากฐานทางทฤษฎีของการทำเหมืองข้อมูลคืออะไร?


มีหลายทฤษฎีสำหรับพื้นฐานของการทำเหมืองข้อมูล ได้แก่ −

การลดข้อมูล − ในทฤษฎีนี้ พื้นฐานของการทำเหมืองข้อมูลคือการลดการแสดงข้อมูล การลดข้อมูลแลกความมั่นใจในความเร็วเพื่อตอบสนองความต้องการในการรับคำตอบโดยประมาณอย่างรวดเร็วสำหรับคำถามในฐานข้อมูลขนาดใหญ่

วิธีการลดข้อมูลรวมถึงการสลายตัวของค่าเอกพจน์ (องค์ประกอบขับเคลื่อนที่อยู่เบื้องหลังการวิเคราะห์องค์ประกอบหลัก) เวฟเล็ต การถดถอย แบบจำลองล็อก-เชิงเส้น ฮิสโตแกรม การจัดกลุ่ม การสุ่มตัวอย่าง และการพัฒนาแผนผังดัชนี

การบีบอัดข้อมูล − ตามทฤษฎีนี้ พื้นฐานของการขุดข้อมูลคือการบีบอัดข้อมูลที่กำหนดโดยการเข้ารหัสในแง่ของบิต กฎการเชื่อมโยง แผนผังการตัดสินใจ คลัสเตอร์ ฯลฯ

การค้นพบรูปแบบ − ในทฤษฎีนี้ พื้นฐานของการขุดข้อมูลคือการค้นหารูปแบบที่ปรากฏในฐานข้อมูล รวมถึงการเชื่อมโยง โมเดลการจำแนก รูปแบบตามลำดับ ฯลฯ มีหลายพื้นที่รวมถึงการเรียนรู้ของเครื่อง, โครงข่ายประสาทเทียม, การทำเหมืองเชื่อมโยง, การทำเหมืองรูปแบบตามลำดับ, การจัดกลุ่ม, และสาขาย่อยต่างๆ มากมายมีส่วนสนับสนุนทฤษฎีนี้

ทฤษฎีความน่าจะเป็น - ขึ้นอยู่กับทฤษฎีทางสถิติ ในทฤษฎีนี้ พื้นฐานของการขุดข้อมูลคือการค้นหาการแจกแจงความน่าจะเป็นร่วมกันของตัวแปรสุ่ม เช่น เครือข่ายความเชื่อแบบเบย์หรือแบบจำลองเบย์เซียนแบบมีลำดับชั้น

มุมมองด้านเศรษฐศาสตร์จุลภาค − มุมมองทางเศรษฐศาสตร์จุลภาคถือว่าการทำเหมืองข้อมูลเป็นบริการในการค้นหารูปแบบที่น่าสนใจเฉพาะในขอบเขตที่สามารถนำมาใช้ในขั้นตอนการตัดสินใจขององค์กรบางแห่งได้ (เช่น เกี่ยวกับแนวทางการตลาดและแผนการผลิต)

มุมมองนี้เป็นหนึ่งในบริการ ซึ่งรูปแบบถือว่าน่าสนใจหากสามารถอ้างอิงได้ องค์กรต่างๆ ถือเป็นปัญหาในการเพิ่มประสิทธิภาพ โดยมีวัตถุประสงค์เพื่อเพิ่มบริการหรือมูลค่าของการตัดสินใจให้สูงสุด ในทฤษฎีนี้ การทำเหมืองข้อมูลจะกลายเป็นปัญหาการปรับให้เหมาะสมที่ไม่เป็นเชิงเส้น

ฐานข้อมูลอุปนัย − ตามทฤษฎีนี้ สคีมาฐานข้อมูลประกอบด้วยข้อมูลและรูปแบบที่บันทึกไว้ในฐานข้อมูล การทำเหมืองข้อมูลเป็นปัญหาของการนำการเหนี่ยวนำไปใช้ในฐานข้อมูล โดยที่ฟังก์ชันคือการสืบค้นข้อมูลและทฤษฎี (เช่น รูปแบบ) ของฐานข้อมูล มุมมองนี้มีชื่อเสียงในหมู่นักวิจัยหลายคนในระบบฐานข้อมูล

ทฤษฎีเหล่านี้ไม่ได้ผูกขาดร่วมกัน ตัวอย่างเช่น การค้นพบรูปแบบยังสามารถมองว่าเป็นการออกแบบการลดข้อมูลหรือการบีบอัดข้อมูล ตามหลักการแล้ว กรอบงานเชิงทฤษฎีจะต้องสามารถจำลองงานการทำเหมืองข้อมูลทั่วไป (รวมถึงการเชื่อมโยง การจำแนกประเภท และการจัดกลุ่ม) มีคุณสมบัติที่น่าจะเป็นไปได้ สามารถจัดการข้อมูลได้หลายรูปแบบ และจัดการกับสาระสำคัญแบบวนซ้ำและโต้ตอบของการทำเหมืองข้อมูล นอกจากนี้ จำเป็นต้องมีความพยายามในการสร้างโครงสร้างที่กำหนดไว้อย่างดีสำหรับการทำเหมืองข้อมูล ซึ่งเป็นไปตามข้อกำหนดเหล่านี้