Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ความแตกต่างระหว่างการจำแนกและการจัดกลุ่มคืออะไร?


การจำแนกประเภท

การจัดประเภทเป็นวิธีการทำเหมืองข้อมูลที่อนุญาตระดับให้กับชุดข้อมูลเพื่อสนับสนุนการคาดการณ์และการวิเคราะห์ที่มีประสิทธิภาพมากขึ้น การจัดประเภทเป็นหนึ่งในวิธีการต่างๆ ที่กำหนดไว้ล่วงหน้าเพื่อให้การวิเคราะห์ชุดข้อมูลระดับสูงมีประสิทธิภาพ

โดยทั่วไป "การจัดประเภท" จะใช้เมื่อมีคลาสเป้าหมายสองคลาสที่เรียกว่าการจำแนกแบบไบนารี เมื่อสามารถคาดการณ์ได้สูงกว่าสองคลาส โดยเฉพาะอย่างยิ่งในประเด็นการจดจำรูปแบบ สิ่งนี้ถูกกำหนดเป็นการจัดประเภทพหุนาม อย่างไรก็ตาม การจำแนกประเภทพหุนามยังใช้สำหรับข้อมูลการตอบสนองขั้นสุดท้าย ซึ่งจำเป็นต้องคาดการณ์ว่าหมวดหมู่ใดจากหลายหมวดหมู่ที่มีอินสแตนซ์ที่มีความน่าจะเป็นมากที่สุด

การจำแนกประเภทเป็นองค์ประกอบที่สำคัญที่สุดในการทำเหมืองข้อมูล กำหนดกระบวนการกำหนดป้ายกำกับคลาสที่กำหนดไว้ล่วงหน้าให้กับอินสแตนซ์ตามแอตทริบิวต์ มีความคล้ายคลึงกันระหว่างการจัดประเภทและการจัดกลุ่ม โดยมองว่าคล้ายกัน แต่ต่างกัน ความแตกต่างที่สำคัญระหว่างการจัดประเภทและการจัดกลุ่มคือการจัดประเภทมีการจัดระดับของรายการตามความเป็นสมาชิกในกลุ่มที่กำหนดไว้ล่วงหน้า

การจัดกลุ่ม

กระบวนการรวมชุดของวัตถุทางกายภาพหรือนามธรรมเข้าในคลาสของวัตถุเดียวกันนั้นเรียกว่าการจัดกลุ่ม คลัสเตอร์คือชุดของออบเจ็กต์ข้อมูลที่เหมือนกันภายในคลัสเตอร์เดียวกันและแตกต่างจากออบเจ็กต์ในคลัสเตอร์อื่น คลัสเตอร์ของออบเจ็กต์ข้อมูลสามารถพิจารณารวมกันเป็นกลุ่มเดียวในหลายแอปพลิเคชัน การวิเคราะห์คลัสเตอร์เป็นกิจกรรมที่สำคัญของมนุษย์

การวิเคราะห์คลัสเตอร์ใช้เพื่อสร้างกลุ่มหรือคลัสเตอร์ของเร็กคอร์ดเดียวกัน ขึ้นอยู่กับการวัดต่างๆ ที่ทำกับเร็กคอร์ดเหล่านี้ การออกแบบที่สำคัญคือการกำหนดคลัสเตอร์ในลักษณะที่สามารถเป็นประโยชน์สำหรับวัตถุประสงค์ของการวิเคราะห์ ข้อมูลนี้ถูกใช้ในหลายด้าน เช่น ดาราศาสตร์ โบราณคดี การแพทย์ เคมี การศึกษา จิตวิทยา ภาษาศาสตร์ และสังคมวิทยา

มีการใช้การวิเคราะห์กลุ่มที่มีชื่อเสียงอย่างหนึ่งในด้านการตลาดสำหรับการแบ่งส่วนตลาด:ผู้ใช้จะถูกแบ่งกลุ่มตามข้อมูลประวัติประชากรและธุรกรรม และเทคนิคการตลาดได้รับการปรับแต่งสำหรับแต่ละกลุ่ม

การวิเคราะห์คลัสเตอร์สามารถใช้กับข้อมูลจำนวนมากได้ ตัวอย่างเช่น เสิร์ชเอ็นจิ้นทางอินเทอร์เน็ตใช้วิธีการจัดกลุ่มเพื่อคลัสเตอร์แบบสอบถามที่ผู้ใช้ส่ง สิ่งเหล่านี้สามารถใช้ในการพัฒนาอัลกอริธึมการค้นหาได้

โดยทั่วไป ข้อมูลพื้นฐานที่ใช้ในการจัดกลุ่มคือตารางการวัดของตัวแปรต่างๆ โดยที่แต่ละคอลัมน์กำหนดตัวแปรและแถวกำหนดระเบียน จุดมุ่งหมายคือการสร้างกลุ่มข้อมูลเพื่อให้ระเบียนเดียวกันอยู่ในกลุ่มเดียวกัน สามารถกำหนดจำนวนคลัสเตอร์ล่วงหน้าหรือตัดสินใจได้จากข้อมูล