Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การวิเคราะห์คลัสเตอร์คืออะไร?


การวิเคราะห์คลัสเตอร์เป็นกิจกรรมที่สำคัญของมนุษย์ การวิเคราะห์คลัสเตอร์ใช้เพื่อสร้างกลุ่มหรือคลัสเตอร์ของเร็กคอร์ดเดียวกัน ขึ้นอยู่กับการวัดต่างๆ ที่ทำกับเร็กคอร์ดเหล่านี้ การออกแบบที่สำคัญคือการกำหนดคลัสเตอร์ในลักษณะที่สามารถเป็นประโยชน์สำหรับวัตถุประสงค์ของการวิเคราะห์ ข้อมูลนี้ถูกใช้ในหลายด้าน เช่น ดาราศาสตร์ โบราณคดี การแพทย์ เคมี การศึกษา จิตวิทยา ภาษาศาสตร์ และสังคมวิทยา

การวิเคราะห์คลัสเตอร์เป็นสาขาหนึ่งของสถิติที่ได้รับการศึกษาอย่างกว้างขวางเป็นเวลาหลายปี ประโยชน์ของการใช้เทคนิคนี้คือสามารถค้นพบโครงสร้างหรือคลัสเตอร์ที่น่าสนใจได้โดยตรงจากข้อมูลโดยไม่ต้องใช้ความรู้พื้นฐานใดๆ เช่น ลำดับชั้นของแนวคิด

อัลกอริธึมการจัดกลุ่มที่ใช้ในสถิติ เช่น PAM หรือ CLARA ได้รับการรายงานว่าไม่มีประสิทธิภาพจากมุมมองของความซับซ้อนในการคำนวณ ตามข้อกังวลด้านประสิทธิภาพ อัลกอริทึมใหม่ที่เรียกว่า CLARANS (Clustering Large Applications ตาม Randomized Search) ได้รับการพัฒนาสำหรับการวิเคราะห์คลัสเตอร์

มีการใช้การวิเคราะห์กลุ่มที่มีชื่อเสียงอย่างหนึ่งในด้านการตลาดสำหรับการแบ่งส่วนตลาด ผู้ใช้จะถูกแบ่งกลุ่มตามข้อมูลประวัติประชากรและธุรกรรม และเทคนิคการตลาดได้รับการปรับแต่งสำหรับแต่ละกลุ่ม

อีกคำหนึ่งใช้สำหรับการวิเคราะห์โครงสร้างตลาดซึ่งระบุทีมของผลิตภัณฑ์เดียวกันตามมาตรการการแข่งขันของความคล้ายคลึงกัน ในด้านการตลาดและการคาดการณ์ทางการเมือง มีการใช้การรวมกลุ่มของละแวกใกล้เคียงโดยใช้รหัสไปรษณีย์ของสหรัฐฯ เพื่อจัดกลุ่มย่านใกล้เคียงตามไลฟ์สไตล์

ในด้านการเงิน การวิเคราะห์คลัสเตอร์สามารถใช้เพื่อสร้างพอร์ตการลงทุนที่สมดุล โดยให้ข้อมูลเกี่ยวกับโอกาสในการลงทุนหลายอย่าง เช่น หุ้น โดยจะค้นหาคลัสเตอร์ได้โดยขึ้นอยู่กับตัวแปรประสิทธิภาพทางการเงิน ซึ่งรวมถึงผลตอบแทน เช่น รายวัน รายสัปดาห์ หรือรายเดือน ความผันผวน เบต้า ฯลฯ รวมถึงอุตสาหกรรมและมูลค่าหลักทรัพย์ตามราคาตลาด

มีการดำเนินการอื่นของการวิเคราะห์คลัสเตอร์ในด้านการเงินสำหรับการวิเคราะห์ตลาด สำหรับอุตสาหกรรมหนึ่งๆ มีความสนใจในการหาทีมจากบริษัทเดียวกันตามมาตรการต่างๆ เช่น อัตราการเติบโต ความสามารถในการทำกำไร ขนาดอุตสาหกรรม กลุ่มผลิตภัณฑ์ และการมีอยู่ในตลาดต่างประเทศหลายแห่ง จากนั้นทีมเหล่านี้สามารถวิเคราะห์เพื่อเรียนรู้โครงสร้างตลาดและตัดสินใจได้ เช่น ใครคือคู่แข่ง

การวิเคราะห์คลัสเตอร์สามารถใช้กับข้อมูลจำนวนมากได้ ตัวอย่างเช่น เสิร์ชเอ็นจิ้นทางอินเทอร์เน็ตใช้วิธีการจัดกลุ่มเพื่อคลัสเตอร์แบบสอบถามที่ผู้ใช้ส่ง สิ่งเหล่านี้สามารถใช้ในการพัฒนาอัลกอริธึมการค้นหาได้

โดยทั่วไป ข้อมูลพื้นฐานที่ใช้ในการจัดกลุ่มคือตารางการวัดของตัวแปรต่างๆ โดยที่แต่ละคอลัมน์กำหนดตัวแปรและแถวกำหนดระเบียน จุดมุ่งหมายคือการสร้างกลุ่มข้อมูลเพื่อให้ระเบียนเดียวกันอยู่ในกลุ่มเดียวกัน สามารถกำหนดจำนวนคลัสเตอร์ล่วงหน้าหรือตัดสินใจได้จากข้อมูล