Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

คุณสมบัติของการทำเหมืองข้อมูลคืออะไร?


การทำเหมืองข้อมูลมีคุณลักษณะต่างๆ ดังนี้ -

ประเภทข้อมูล − ระบบการทำเหมืองข้อมูลส่วนใหญ่ที่เข้าถึงได้ในอุตสาหกรรมจะจัดการข้อมูลที่จัดรูปแบบ อิงตามบันทึก คล้ายเชิงสัมพันธ์ พร้อมด้วยคุณลักษณะทางสถิติ หมวดหมู่ และสัญลักษณ์ ข้อมูลสามารถอยู่ในรูปแบบของข้อความ ASCII ข้อมูลฐานข้อมูลเชิงสัมพันธ์ หรือข้อมูลคลังข้อมูล จำเป็นต้องทดสอบว่าแต่ละระบบที่จัดการรูปแบบใดสามารถจัดการรูปแบบใดได้บ้าง

ข้อมูลหรือแอปพลิเคชันบางประเภทอาจต้องใช้อัลกอริธึมเฉพาะในการค้นหารูปแบบ ดังนั้นข้อกำหนดของข้อมูลหรือแอปพลิเคชันบางประเภทจึงไม่สามารถจัดการได้โดยระบบการทำเหมืองข้อมูลทั่วไปที่ไม่มีขายทั่วไป แทนที่จะใช้ระบบการทำเหมืองข้อมูลแบบพิเศษ ซึ่งขุดรายงานข้อความ ข้อมูลเชิงพื้นที่ ข้อมูลมัลติมีเดีย ข้อมูลสตรีม ข้อมูลลำดับเวลา ข้อมูลชีวภาพ หรือข้อมูลเว็บ หรือใช้สำหรับแอปพลิเคชันเฉพาะ (รวมถึงการเงิน อุตสาหกรรมค้าปลีก) หรือโทรคมนาคม)

ปัญหาของระบบ − ระบบการทำเหมืองข้อมูลที่กำหนดสามารถทำงานบนเฟรมเวิร์กการทำงานเดียวหรือหลายเฟรมเวิร์ก ระบบปฏิบัติการที่มีชื่อเสียงซึ่งโฮสต์ซอฟต์แวร์การทำเหมืองข้อมูล ได้แก่ UNIX/Linux และ Microsoft Windows นอกจากนี้ยังมีระบบขุดข้อมูลที่ทำงานบน Macintosh, OS/2 เป็นต้น ข้อมูลขนาดใหญ่ที่เน้นตลาด

ระบบการทำเหมืองข้อมูลที่เน้นตลาดขนาดใหญ่มักใช้สถาปัตยกรรมไคลเอนต์/เซิร์ฟเวอร์ โดยที่ไคลเอนต์สามารถเป็นคอมพิวเตอร์ส่วนบุคคลได้ และเซิร์ฟเวอร์สามารถเป็นชุดของคอมพิวเตอร์คู่ขนานที่ทรงพลัง เทรนด์ปัจจุบันมีระบบการขุดข้อมูลที่รองรับอินเทอร์เฟซบนเว็บและเปิดใช้งานข้อมูล XML เป็นอินพุตและ/หรือเอาต์พุต

แหล่งข้อมูล − สิ่งนี้กำหนดรูปแบบข้อมูลเฉพาะที่ระบบการทำเหมืองข้อมูลจะทำงาน บางระบบทำงานบนไฟล์ข้อความ ASCII เท่านั้น ในขณะที่บางระบบทำงานกับข้อมูลเชิงสัมพันธ์ หรือข้อมูลคลังข้อมูล เข้าถึงแหล่งข้อมูลเชิงสัมพันธ์หลายแห่ง

ระบบการทำเหมืองข้อมูลต้องมีการเชื่อมต่อ ODBC หรือ OLE DB สำหรับการเชื่อมต่อ ODBC สิ่งเหล่านี้ให้การเชื่อมต่อฐานข้อมูลแบบเปิด โดยเฉพาะอย่างยิ่ง ความสามารถในการเข้าถึงข้อมูลเชิงสัมพันธ์ใดๆ (ที่เกี่ยวข้องกับข้อมูลเหล่านั้นใน IBM/DB2, Microsoft SQL Server, Microsoft Access, Oracle, Sybase ฯลฯ) และข้อมูลข้อความ ASCII ที่จัดรูปแบบ

ฟังก์ชันและวิธีการขุดข้อมูล − ฟังก์ชันการขุดข้อมูลเป็นหัวใจของระบบการทำเหมืองข้อมูล ระบบการทำเหมืองข้อมูลบางระบบรองรับฟังก์ชันการทำเหมืองข้อมูลเพียงฟังก์ชันเดียว เช่น การจำแนกประเภท ฟังก์ชันอื่นๆ สามารถช่วยฟังก์ชันการทำเหมืองข้อมูลได้หลากหลาย ซึ่งรวมถึงคำอธิบายแนวคิด การวิเคราะห์ OLAP ที่ขับเคลื่อนด้วยการค้นพบ การทำเหมืองข้อมูลการเชื่อมโยง การวิเคราะห์การเชื่อมโยง การวิเคราะห์ทางสถิติ การจัดประเภท การทำนาย การจัดกลุ่ม การวิเคราะห์ค่าผิดปกติ การค้นหาความคล้ายคลึงกัน การวิเคราะห์รูปแบบตามลำดับ และการขุดข้อมูลด้วยภาพ

สำหรับฟังก์ชันการทำเหมืองข้อมูลที่กำหนด (รวมถึงการจำแนกประเภท) ระบบบางระบบสามารถให้วิธีเดียวเท่านั้น ในขณะที่บางระบบสามารถจัดเตรียมวิธีการได้หลากหลาย (รวมถึงการวิเคราะห์แผนผังการตัดสินใจ เครือข่ายเบย์เซียน เครือข่ายประสาท เวกเตอร์เครื่องสนับสนุน การจำแนกตามกฎเกณฑ์ วิธี k-neighbour อัลกอริทึมทางพันธุกรรม และการใช้เหตุผลตามกรณี)

ระบบการทำเหมืองข้อมูลที่มีฟังก์ชันการทำเหมืองข้อมูลหลายแบบและหลายวิธีต่อฟังก์ชัน สนับสนุนผู้ใช้ด้วยความยืดหยุ่นและพลังในการวิเคราะห์ที่สูงขึ้น ปัญหาบางอย่างอาจทำให้ผู้ใช้ต้องลองใช้ฟังก์ชันการขุดที่แตกต่างกันสองสามอย่างหรือรวมหลาย ๆ อย่างเข้าด้วยกัน และวิธีการที่แตกต่างกันอาจมีประสิทธิภาพมากกว่าวิธีอื่นๆ สำหรับข้อมูลประเภทต่างๆ