กระบวนการรวมชุดของวัตถุทางกายภาพหรือนามธรรมเข้าในคลาสของวัตถุเดียวกันนั้นเรียกว่าการจัดกลุ่ม คลัสเตอร์คือชุดของออบเจ็กต์ข้อมูลที่เหมือนกันภายในคลัสเตอร์เดียวกันและแตกต่างจากออบเจ็กต์ในคลัสเตอร์อื่น คลัสเตอร์ของออบเจ็กต์ข้อมูลสามารถพิจารณารวมกันเป็นกลุ่มเดียวในหลายแอปพลิเคชัน การวิเคราะห์คลัสเตอร์เป็นกิจกรรมที่สำคัญของมนุษย์
การวิเคราะห์คลัสเตอร์ใช้เพื่อสร้างกลุ่มหรือคลัสเตอร์ของเร็กคอร์ดเดียวกัน ขึ้นอยู่กับการวัดต่างๆ ที่ทำกับเร็กคอร์ดเหล่านี้ การออกแบบที่สำคัญคือการกำหนดคลัสเตอร์ในลักษณะที่สามารถเป็นประโยชน์สำหรับวัตถุประสงค์ของการวิเคราะห์ ข้อมูลนี้ถูกใช้ในหลายด้าน เช่น ดาราศาสตร์ โบราณคดี การแพทย์ เคมี การศึกษา จิตวิทยา ภาษาศาสตร์ และสังคมวิทยา
มีการใช้การวิเคราะห์กลุ่มที่มีชื่อเสียงอย่างหนึ่งในด้านการตลาดสำหรับการแบ่งส่วนตลาด ผู้ใช้จะถูกแบ่งกลุ่มตามข้อมูลประวัติประชากรและธุรกรรม และเทคนิคการตลาดได้รับการปรับแต่งสำหรับแต่ละกลุ่ม
อีกคำหนึ่งใช้สำหรับการวิเคราะห์โครงสร้างตลาดซึ่งระบุทีมของผลิตภัณฑ์เดียวกันตามมาตรการการแข่งขันของความคล้ายคลึงกัน ในด้านการตลาดและการคาดการณ์ทางการเมือง มีการใช้การรวมกลุ่มของละแวกใกล้เคียงโดยใช้รหัสไปรษณีย์ของสหรัฐฯ เพื่อจัดกลุ่มย่านใกล้เคียงตามไลฟ์สไตล์
ในด้านการเงิน การวิเคราะห์คลัสเตอร์สามารถใช้เพื่อสร้างพอร์ตการลงทุนที่สมดุล − จากข้อมูลโอกาสในการลงทุนที่หลากหลาย (เช่น หุ้น) เราสามารถค้นหาคลัสเตอร์ตามตัวแปรประสิทธิภาพทางการเงิน รวมถึงผลตอบแทน (รายวัน รายสัปดาห์ หรือรายเดือน) ความผันผวน เบต้า และ ลักษณะอื่นๆ รวมทั้งอุตสาหกรรมและมูลค่าตลาด การเลือกหลักทรัพย์จากหลายคลัสเตอร์สามารถช่วยสร้างพอร์ตที่สมดุลได้
มีการดำเนินการอื่นของการวิเคราะห์คลัสเตอร์ในด้านการเงินสำหรับการวิเคราะห์ตลาด สำหรับอุตสาหกรรมหนึ่งๆ มีความสนใจในการหาทีมจากบริษัทเดียวกันตามมาตรการต่างๆ เช่น อัตราการเติบโต ความสามารถในการทำกำไร ขนาดอุตสาหกรรม กลุ่มผลิตภัณฑ์ และการมีอยู่ในตลาดต่างประเทศหลายแห่ง จากนั้นทีมเหล่านี้สามารถวิเคราะห์เพื่อเรียนรู้โครงสร้างตลาดและตัดสินใจได้ เช่น ใครคือคู่แข่ง
การวิเคราะห์คลัสเตอร์สามารถใช้กับข้อมูลจำนวนมากได้ ตัวอย่างเช่น เสิร์ชเอ็นจิ้นทางอินเทอร์เน็ตใช้วิธีการจัดกลุ่มเพื่อคลัสเตอร์แบบสอบถามที่ผู้ใช้ส่ง สิ่งเหล่านี้สามารถใช้ในการพัฒนาอัลกอริธึมการค้นหาได้
โดยทั่วไป ข้อมูลพื้นฐานที่ใช้ในการจัดกลุ่มคือตารางการวัดของตัวแปรต่างๆ โดยที่แต่ละคอลัมน์กำหนดตัวแปรและแถวกำหนดระเบียน จุดมุ่งหมายคือการสร้างกลุ่มข้อมูลเพื่อให้ระเบียนเดียวกันอยู่ในกลุ่มเดียวกัน สามารถกำหนดจำนวนคลัสเตอร์ล่วงหน้าหรือตัดสินใจได้จากข้อมูล