กระบวนการรวมชุดของวัตถุทางกายภาพหรือนามธรรมเข้าในคลาสของวัตถุเดียวกันนั้นเรียกว่าการจัดกลุ่ม คลัสเตอร์คือชุดของออบเจ็กต์ข้อมูลที่เหมือนกันภายในคลัสเตอร์เดียวกันและแตกต่างจากออบเจ็กต์ในคลัสเตอร์อื่น คลัสเตอร์ของออบเจ็กต์ข้อมูลสามารถพิจารณารวมกันเป็นกลุ่มเดียวในหลายแอปพลิเคชัน การวิเคราะห์คลัสเตอร์เป็นกิจกรรมที่สำคัญของมนุษย์
การวิเคราะห์คลัสเตอร์ใช้เพื่อสร้างกลุ่มหรือคลัสเตอร์ของเร็กคอร์ดเดียวกัน ขึ้นอยู่กับการวัดต่างๆ ที่ทำกับเร็กคอร์ดเหล่านี้ การออกแบบที่สำคัญคือการกำหนดคลัสเตอร์ในลักษณะที่สามารถเป็นประโยชน์สำหรับวัตถุประสงค์ของการวิเคราะห์ ข้อมูลนี้ถูกใช้ในหลายด้าน เช่น ดาราศาสตร์ โบราณคดี การแพทย์ เคมี การศึกษา จิตวิทยา ภาษาศาสตร์ และสังคมวิทยา
มีตัวอย่างการจัดกลุ่มดังต่อไปนี้ -
ชีววิทยา − นักชีววิทยาใช้เวลาหลายปีในการผลิตอนุกรมวิธาน (การจำแนกตามลำดับชั้น) ของสิ่งมีชีวิตทั้งหมด เช่น อาณาจักร ไฟลัม คลาส ซีรีส์ ครอบครัว สกุล และสปีชีส์ ดังนั้นจึงไม่น่าแปลกใจที่งานช่วงแรกๆ ในการวิเคราะห์แบบคลัสเตอร์พยายามที่จะสร้างวินัยของอนุกรมวิธานเชิงตัวเลขที่สามารถค้นหาโครงสร้างการจำแนกประเภทดังกล่าวได้
นอกจากนี้ นักชีววิทยายังใช้การจัดกลุ่มเพื่อวิเคราะห์ข้อมูลทางพันธุกรรมจำนวนมหาศาลที่สามารถเข้าถึงได้ ตัวอย่างเช่น การจัดกลุ่มถูกใช้เพื่อค้นหากลุ่มของยีนที่มีหน้าที่เหมือนกัน
การดึงข้อมูล − เวิลด์ไวด์เว็บประกอบด้วยหน้าเว็บหลายพันล้านหน้า และผลลัพธ์ของการค้นหาไปยังเครื่องมือค้นหาสามารถกู้คืนหน้าได้หลายล้านหน้า การจัดกลุ่มสามารถใช้เพื่อจัดกลุ่มผลการค้นหาเหล่านี้ออกเป็นหลายคลัสเตอร์ โดยแต่ละคลัสเตอร์ใช้องค์ประกอบเฉพาะของการค้นหา
ตัวอย่างเช่น คำค้นหา "ภาพยนตร์" สามารถกู้คืนหน้าเว็บที่รวมกันเป็นหมวดหมู่ต่างๆ เช่น บทวิจารณ์ ตัวอย่าง ดารา และโรงภาพยนตร์ แต่ละคลัสเตอร์สามารถแบ่งออกเป็นหมวดหมู่ย่อย (คลัสเตอร์ย่อย) ทำให้โครงสร้างแบบลำดับชั้นที่สนับสนุนการวิเคราะห์ของผู้ใช้ผลลัพธ์การค้นหา
ภูมิอากาศ − มันสามารถเรียนรู้สภาพอากาศของโลกที่จำเป็นต้องค้นพบรูปแบบในชั้นบรรยากาศและมหาสมุทร การวิเคราะห์กลุ่มถูกนำมาใช้เพื่อค้นหารูปแบบในความกดอากาศของบริเวณขั้วโลกและพื้นที่ในมหาสมุทรที่มีผลกระทบสำคัญต่อสภาพอากาศของแผ่นดิน
จิตวิทยาและการแพทย์ − การเจ็บป่วยหรือสภาวะต่างๆ มักมีการเปลี่ยนแปลงหลายอย่าง และการศึกษาแบบกลุ่มสามารถนำมาใช้เพื่อจำแนกหมวดหมู่ย่อยหลายหมวดหมู่เหล่านี้ได้ ตัวอย่างเช่น การจัดกลุ่มสามารถใช้ระบุภาวะซึมเศร้าได้หลายประเภท การวิเคราะห์คลัสเตอร์ยังใช้เพื่อระบุรูปแบบในการจัดสรรโรคในเชิงพื้นที่หรือชั่วคราว
ธุรกิจ − ธุรกิจรวบรวมข้อมูลจำนวนมากเกี่ยวกับผู้ใช้ปัจจุบันและผู้ใช้ที่มีศักยภาพ โดยทั่วไปจะใช้เพื่อแบ่งผู้ใช้ออกเป็นกลุ่มเล็กๆ สำหรับการวิเคราะห์และกิจกรรมทางการตลาดเพิ่มเติม