Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

วิธีการสร้าง Ensemble Classifier คืออะไร?


แนวคิดคือการสร้างตัวแยกประเภทหลายตัวจากข้อมูลเริ่มต้น จากนั้นจึงรวมการคาดการณ์เมื่ออธิบายตัวอย่างที่ไม่รู้จัก กลุ่มลักษณนามสามารถสร้างได้หลายวิธีดังนี้ −

ด้วยการจัดการชุดการฝึก − ในวิธีนี้ ชุดการฝึกหลายชุดจะถูกสร้างขึ้นโดยการสุ่มตัวอย่างข้อมูลเริ่มต้นใหม่ตามการกระจายตัวอย่างบางส่วน การกระจายการสุ่มตัวอย่างจะตัดสินใจว่าจะเลือกอินสแตนซ์สำหรับการฝึกอบรมมากเพียงใด และสามารถเปลี่ยนจากการทดลองหนึ่งเป็นอีกรุ่นหนึ่งได้ ตัวแยกประเภทถูกสร้างขึ้นจากชุดการฝึกอบรมแต่ละชุดโดยใช้อัลกอริธึมการเรียนรู้เฉพาะ การบรรจุและการเพิ่มกำลังเป็นตัวอย่างของวิธีการทั้งมวลที่ควบคุมชุดการฝึกของพวกเขา

โดยจัดการคุณสมบัติการป้อนข้อมูล − ในวิธีนี้ เซตย่อยของคุณสมบัติอินพุตจะถูกเลือกเพื่อสร้างชุดการฝึกทุกชุด เซตย่อยสามารถเลือกแบบสุ่มหรือขึ้นอยู่กับคำแนะนำของผู้เชี่ยวชาญด้านโดเมน ผลการศึกษาหลายชิ้นแสดงให้เห็นว่าวิธีนี้ใช้ได้ผลดีกับชุดข้อมูลที่มีคุณลักษณะซ้ำซ้อนอย่างมหาศาล ฟอเรสต์สุ่มเป็นเทคนิคทั้งมวลที่จัดการคุณลักษณะอินพุตและต้องใช้แผนผังการตัดสินใจเป็นตัวแยกประเภทพื้นฐาน

โดยการจัดการป้ายกำกับคลาส − วิธีนี้สามารถใช้ได้เมื่อหลายคลาสมีขนาดใหญ่เพียงพอ ข้อมูลการฝึกจะเปลี่ยนเป็นปัญหาคลาสไบนารีโดยสุ่มแบ่งกลุ่มย่อยออกเป็นสองชุดย่อยที่ไม่ปะติดปะต่อกัน เช่น A0 และ A1

อินสแตนซ์การฝึกอบรมที่มีป้ายกำกับคลาสใช้กับชุดย่อย A0 ถูกกำหนดให้กับคลาส 0 ในขณะที่อินสแตนซ์ที่ใช้กับเซตย่อย A1 ถูกกำหนดให้กับคลาส 1 อินสแตนซ์ที่ติดป้ายกำกับใหม่ใช้เพื่อฝึกตัวแยกประเภทพื้นฐาน เมื่อเกิดซ้ำ ขั้นตอนการติดป้ายกำกับคลาสและการสร้างแบบจำลองหลายครั้ง จะได้รับชุดตัวแยกประเภทพื้นฐาน

เมื่อมีการนำเสนอตัวอย่างการทดสอบ ตัวแยกประเภทฐานแต่ละตัว Ci สามารถทำนายป้ายกำกับของคลาสได้ หากคาดการณ์อินสแตนซ์การทดสอบเป็นคลาส 0 ดังนั้นทุกคลาสที่ใช้กับ A0 จะได้รับการโหวต

โดยการจัดการอัลกอริทึมการเรียนรู้ − อัลกอริธึมการเรียนรู้จำนวนมากสามารถถูกจัดการในวิธีการที่การใช้อัลกอริธึมหลายครั้งกับข้อมูลการฝึกที่เท่ากันสามารถส่งผลให้เกิดแบบจำลองได้หลายแบบ ตัวอย่างเช่น โครงข่ายประสาทเทียมสามารถสร้างแบบจำลองได้หลายแบบโดยการปรับเปลี่ยนโครงสร้างเครือข่ายหรือน้ำหนักเดิมของการเชื่อมต่อระหว่างเซลล์ประสาท ในทำนองเดียวกัน สามารถประกอบชุดต้นไม้ตัดสินใจได้ด้วยการใส่การสุ่มเข้าไปในกระบวนการปลูกต้นไม้

สามวิธีแรกเป็นเทคนิคทั่วไปที่เกี่ยวข้องกับตัวแยกประเภท ในขณะที่วิธีที่สี่จะขึ้นอยู่กับประเภทของตัวแยกประเภทที่ใช้ คุณสามารถสร้างเมธอดตัวแยกประเภทพื้นฐานได้ตามลำดับ (ทีละรายการ) หรือแบบขนาน (ทั้งหมดในคราวเดียว)

กระบวนการแรกคือการผลิตชุดฝึกอบรมจากข้อมูลเริ่มต้น D โดยขึ้นอยู่กับประเภทของวงดนตรีที่ใช้ ชุดฝึกอบรมเป็นแบบที่แน่นอนหรือแปลงเล็กน้อยของ D ขนาดของชุดฝึกอบรมยังคงเหมือนเดิม ข้อมูลเริ่มต้น แต่การกระจายของอินสแตนซ์ไม่สามารถเหมือนกันได้ เช่น บางอินสแตนซ์สามารถเกิดขึ้นได้หลายครั้งในชุดการฝึก ในขณะที่บางกรณีไม่สามารถเกิดขึ้นได้แม้แต่ครั้งเดียว