Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การวิเคราะห์องค์ประกอบหลักคืออะไร


การวิเคราะห์องค์ประกอบหลักเป็นอัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลซึ่งใช้สำหรับการลดมิติในการเรียนรู้ของเครื่อง เป็นกระบวนการทางสถิติที่เปลี่ยนการสังเกตคุณลักษณะที่มีความสัมพันธ์กันเป็นชุดของคุณลักษณะที่ไม่สัมพันธ์กันเชิงเส้นโดยสนับสนุนข้อมูลมุมฉาก คุณลักษณะที่เปลี่ยนแปลงใหม่เหล่านี้เรียกว่าส่วนประกอบหลัก

เป็นเครื่องมือที่มีชื่อเสียงที่ใช้ในการวิเคราะห์ข้อมูลเชิงสำรวจและทำนายแบบจำลอง เป็นแนวทางในการวาดการออกแบบที่แข็งแกร่งจากชุดข้อมูลที่กำหนดโดยการลดความแปรปรวน

PCA ทำงานโดยพิจารณาความแปรปรวนของแต่ละแอตทริบิวต์เนื่องจากแอตทริบิวต์สูงแสดงการแบ่งระหว่างชั้นเรียนและดังนั้นจึงช่วยลดมิติ การใช้งาน PCA ในโลกแห่งความเป็นจริง ได้แก่ การประมวลผลภาพ ระบบแนะนำภาพยนตร์ การปรับการจัดสรรพลังงานให้เหมาะสมในช่องทางการสื่อสารต่างๆ เป็นวิธีการดึงข้อมูลคุณลักษณะ ดังนั้นจึงรวมตัวแปรที่สำคัญและลดตัวแปรที่มีความสำคัญน้อยที่สุด

การวิเคราะห์องค์ประกอบหลักเรียกอีกอย่างว่าวิธี Karhunen-Loeve หรือ KL มันสามารถค้นหาเวกเตอร์มุมฉาก k n มิติที่สามารถนำมาใช้เพื่อแสดงข้อมูลได้ดีที่สุด โดยที่ k ≤ n ข้อมูลเดิมถูกฉายลงในพื้นที่ที่เล็กกว่ามาก ซึ่งส่งผลให้มิติลดลง มันเชื่อมโยงแก่นแท้ของแอตทริบิวต์โดยการสร้างชุดตัวแปรทางเลือกที่มีขนาดเล็กลง ข้อมูลเริ่มต้นสามารถฉายลงบนชุดที่เล็กกว่านี้ได้

มีขั้นตอนต่อไปนี้ที่ใช้ใน PCA เป็นดังนี้ -

  • ข้อมูลที่ป้อนเข้าจะถูกทำให้เป็นมาตรฐานเพื่อให้แต่ละแอตทริบิวต์อยู่ในช่วงเดียวกัน ขั้นตอนนี้ช่วยให้แน่ใจว่าแอตทริบิวต์ที่มีโดเมนขนาดใหญ่จะไม่ครอบงำแอตทริบิวต์ที่มีโดเมนที่เล็กกว่า

  • PCA ประเมินเวกเตอร์ออร์โธนอร์มัล k ตัวที่รองรับพื้นฐานสำหรับข้อมูลอินพุตที่ทำให้เป็นมาตรฐาน เหล่านี้เป็นเวกเตอร์หน่วยที่แต่ละจุดมีทิศทางตั้งฉากกับจุดอื่น เวกเตอร์เหล่านี้ถูกกำหนดให้เป็นองค์ประกอบหลัก ข้อมูลที่ป้อนเป็นชุดเชิงเส้นของส่วนประกอบหลัก

  • ส่วนประกอบหลักจัดเรียงตามลำดับ "ความสำคัญ" หรือความแข็งแกร่งที่ลดลง ส่วนประกอบหลักทำหน้าที่เป็นแกนชุดใหม่สำหรับข้อมูล โดยให้ข้อมูลสำคัญเกี่ยวกับความแปรปรวน กล่าวคือ แกนที่จัดเรียงเป็นแบบที่แกนแรกแสดงความแปรปรวนมากที่สุดในบรรดาข้อมูล แกนที่สองแสดงความแปรปรวนสูงสุดถัดไป เป็นต้น

  • เนื่องจากส่วนประกอบต่างๆ ถูกจัดเรียงตามลำดับ "ความสำคัญ" ที่ลดลง ขนาดของข้อมูลจึงสามารถลดลงได้โดยการนำส่วนประกอบที่อ่อนแอกว่าออก กล่าวคือ ส่วนประกอบที่มีความแปรปรวนต่ำ การใช้องค์ประกอบหลักที่รัดกุมที่สุด ควรสร้างการประมาณค่าข้อมูลต้นฉบับที่ดีได้อีกครั้ง