Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การทำเหมืองข้อมูลมีฟังก์ชันอะไรบ้าง?


ฟังก์ชันการทำเหมืองข้อมูลถูกใช้เพื่อแสดงประเภทของรูปแบบที่ต้องค้นพบในงานการทำเหมืองข้อมูล โดยทั่วไป งานเหมืองข้อมูลสามารถจำแนกได้เป็น 2 ประเภท ได้แก่ เชิงพรรณนาและเชิงพยากรณ์ งานการขุดเชิงพรรณนาจะกำหนดคุณสมบัติทั่วไปของข้อมูลในฐานข้อมูล และงานการขุดเชิงพยากรณ์จะทำการอนุมานข้อมูลปัจจุบันเพื่อพัฒนาการคาดการณ์

มีฟังก์ชันการทำเหมืองข้อมูลต่างๆ ดังต่อไปนี้ -

  • การกำหนดลักษณะข้อมูล − เป็นการสรุปลักษณะทั่วไปของคลาสอ็อบเจ็กต์ของข้อมูล ข้อมูลที่สอดคล้องกับคลาสที่ผู้ใช้ระบุโดยทั่วไปจะถูกรวบรวมโดยแบบสอบถามฐานข้อมูล ผลลัพธ์ของการกำหนดลักษณะข้อมูลสามารถนำเสนอได้หลายรูปแบบ

  • การเลือกปฏิบัติของข้อมูล − เป็นการเปรียบเทียบลักษณะทั่วไปของออบเจ็กต์ข้อมูลคลาสเป้าหมายกับลักษณะทั่วไปของออบเจ็กต์จากคลาสหนึ่งหรือชุดของคลาสที่ตัดกัน ผู้ใช้สามารถแสดงคลาสเป้าหมายและคอนทราสต์ได้ และออบเจ็กต์ข้อมูลที่เทียบเท่าจะถูกดึงผ่านการสืบค้นฐานข้อมูล

  • การวิเคราะห์สมาคม − มันวิเคราะห์ชุดของรายการที่โดยทั่วไปเกิดขึ้นร่วมกันในชุดข้อมูลธุรกรรม มีสองพารามิเตอร์ที่ใช้สำหรับกำหนดกฎการเชื่อมโยง -

    • ซึ่งระบุรายการทั่วไปที่ตั้งไว้ในฐานข้อมูล

    • ความมั่นใจคือความน่าจะเป็นแบบมีเงื่อนไขที่รายการหนึ่งเกิดขึ้นในธุรกรรมเมื่อมีรายการอื่นเกิดขึ้น

  • การจำแนกประเภท การจัดประเภทเป็นขั้นตอนในการค้นหาแบบจำลองที่เป็นตัวแทนและแยกแยะชั้นข้อมูลหรือแนวคิด เพื่อวัตถุประสงค์ในการใช้แบบจำลองในการทำนายคลาสของวัตถุที่มีป้ายชื่อชั้นไม่ระบุชื่อ โมเดลที่ได้รับนั้นสร้างขึ้นจากการวิเคราะห์ชุดข้อมูลการฝึก (เช่น ออบเจ็กต์ข้อมูลที่มีป้ายกำกับคลาสร่วมกัน)

  • พยากรณ์ − มันกำหนดค่าคาดการณ์บางค่าข้อมูลที่ไม่พร้อมใช้งานหรือแนวโน้มที่รอดำเนินการ วัตถุสามารถคาดการณ์ได้ตามค่าแอตทริบิวต์ของวัตถุและค่าแอตทริบิวต์ของชั้นเรียน อาจเป็นการคาดคะเนค่าตัวเลขที่ขาดหายไปหรือเพิ่ม/ลดแนวโน้มของข้อมูลที่เกี่ยวข้องกับเวลา

  • การจัดกลุ่ม − คล้ายกับการจำแนกประเภทแต่ไม่ได้กำหนดคลาสไว้ล่วงหน้า คลาสแสดงโดยแอตทริบิวต์ข้อมูล เป็นการเรียนรู้แบบไม่มีผู้ดูแล ออบเจ็กต์ถูกจัดกลุ่มหรือจัดกลุ่ม ขึ้นอยู่กับหลักการของการเพิ่มความคล้ายคลึงภายในคลาสให้มากที่สุดและการลดความคล้ายคลึงในคลาสให้น้อยที่สุด

  • การวิเคราะห์ค่าผิดปกติ − Outliers เป็นองค์ประกอบข้อมูลที่ไม่สามารถจัดกลุ่มในคลาสหรือคลัสเตอร์ที่กำหนด นี่คือออบเจ็กต์ข้อมูลที่มีพฤติกรรมหลายอย่างจากพฤติกรรมทั่วไปของออบเจ็กต์ข้อมูลอื่น การวิเคราะห์ข้อมูลประเภทนี้มีความสำคัญต่อการขุดความรู้

  • การวิเคราะห์วิวัฒนาการ − กำหนดแนวโน้มสำหรับวัตถุที่พฤติกรรมเปลี่ยนแปลงไปในช่วงเวลาหนึ่ง