Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

SOM คืออะไร?


SOM แสดงถึงแผนผังคุณลักษณะการจัดระเบียบตนเอง เป็นวิธีการจัดกลุ่มและการสร้างภาพข้อมูลขึ้นอยู่กับมุมมองของโครงข่ายประสาทเทียม วัตถุประสงค์ของ SOM คือการค้นหาชุดของเซนทรอยด์ (เวกเตอร์อ้างอิงในคำศัพท์ SOM) และสร้างแต่ละออบเจ็กต์ในชุดข้อมูลไปยังเซนทรอยด์ที่สนับสนุนความใกล้ชิดที่สุดของวัตถุนั้น ในวิธีโครงข่ายประสาทเทียม มีหนึ่งเซลล์ประสาทที่เกี่ยวข้องกับเซนทรอยด์แต่ละอัน

เช่นเดียวกับค่าเฉลี่ย K ที่เพิ่มขึ้น ออบเจ็กต์ข้อมูลจะถูกแบ่งทีละขั้นและเซนทรอยด์ที่ใกล้ที่สุดจะถูกรีเฟรช ไม่เหมือนกับ K-mean SOM กำหนดให้มีการจัดลำดับภูมิประเทศบนเซนทรอยด์ และเซนทรอยด์ที่อยู่ใกล้เคียงจะได้รับการอัปเกรดด้วย นอกจากนี้ SOM จะไม่เก็บเครื่องหมายของการเป็นสมาชิกคลัสเตอร์ล่าสุดของอ็อบเจ็กต์ และไม่เหมือนกับ K-mean หากอ็อบเจ็กต์สลับคลัสเตอร์ ไม่มีการรีเฟรชเฉพาะของ centroid คลัสเตอร์เก่า

คลัสเตอร์เก่าสามารถอยู่ในบริเวณใกล้เคียงของคลัสเตอร์ใหม่ ดังนั้นจึงมีการอัปเดตห้องโดยสารด้วยเหตุผลดังกล่าว การประมวลผลคะแนนจะดำเนินต่อไปจนกว่าจะถึงขีดจำกัดที่กำหนดไว้ล่วงหน้าหรือเซนทรอยด์ไม่เปลี่ยนแปลงมากนัก ผลลัพธ์สุดท้ายของแนวทาง SOM คือชุดของเซนทรอยด์ที่แสดงคลัสเตอร์โดยปริยาย แต่ละคลัสเตอร์มีจุดที่ใกล้กับเซนทรอยด์ที่เจาะจงที่สุด

เซนทรอยด์แต่ละตัวถูกสร้างขึ้นเป็นคู่ของพิกัด (i, j) บางครั้ง เครือข่ายดังกล่าวมีการเชื่อมต่อระหว่างโหนดที่อยู่ติดกัน แต่นั่นอาจทำให้เข้าใจผิดได้เนื่องจากพลังของเซนทรอยด์หนึ่งไปยังอีกจุดหนึ่งเป็นพื้นที่ใกล้เคียงที่แสดงด้วยวิธีพิกัด ไม่ใช่ลิงก์ มีเครือข่ายประสาท SOM หลายประเภท แต่สามารถจำกัดการสนทนานี้ไว้ที่ SOM สองมิติที่มีการจัดระเบียบรูปสี่เหลี่ยมผืนผ้าหรือหกเหลี่ยมของเซนทรอยด์

Centroids ที่ใช้ใน SOM มีความสัมพันธ์ในการจัดลำดับภูมิประเทศที่กำหนดไว้ล่วงหน้า ในระหว่างขั้นตอนการฝึกอบรม SOM ต้องการจุดข้อมูลแต่ละจุดเพื่อรีเฟรชเซนทรอยด์ที่ใกล้ที่สุดและเซนทรอยด์ที่อยู่ใกล้เคียงในการจัดลำดับภูมิประเทศ ในวิธีนี้ SOM จะสร้างชุดเซนทรอยด์ที่เรียงลำดับสำหรับชุดข้อมูลที่กำหนด

ในอีกแง่หนึ่ง เซนทรอยด์ที่อยู่ใกล้กันในกริด SOM จะสัมพันธ์กันอย่างใกล้ชิดกว่าเซนทรอยด์ที่อยู่ไกลออกไป เนื่องจากข้อจำกัดนี้ เซนทรอยด์ของ SOM แบบสองมิติจึงถือได้ว่าวางอยู่บนพื้นผิวสองมิติที่พยายามปรับให้พอดีกับข้อมูล n-dimensional ที่เป็นไปได้มากขึ้น