Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

อะไรคือความแตกต่างระหว่าง Bagging และ Boosting?


การบรรจุ

การบรรจุถุงเรียกอีกอย่างว่าการรวมบูตสแตรป เป็นวิธีการเรียนรู้ทั้งมวลที่ใช้โดยทั่วไปเพื่อลดความแปรปรวนภายในชุดข้อมูลที่มีเสียงดัง ในการบรรจุถุง ระบบจะเลือกตัวอย่างข้อมูลแบบสุ่มในชุดการฝึกโดยมีการแทนที่ ซึ่งหมายความว่าจะเลือกจุดข้อมูลเดียวได้มากกว่า 1 ครั้ง

หลังจากสร้างตัวอย่างข้อมูลหลายตัวอย่างแล้ว แบบจำลองที่อ่อนแอเหล่านี้จะได้รับการฝึกอบรมแยกกันและขึ้นอยู่กับองค์ประกอบของการถดถอยของงานหรือการจัดประเภท ตัวอย่างเช่น ค่าเฉลี่ยของการคาดการณ์เหล่านั้นให้ค่าประมาณที่มีประสิทธิภาพมากขึ้น

Random Forest เป็นส่วนขยายของการบรรจุถุง ต้องใช้อีกหนึ่งขั้นตอนในการคาดเดาชุดย่อยของเรคคอร์ดแบบสุ่ม นอกจากนี้ยังสร้างการสุ่มเลือกคุณสมบัติแทนที่จะใช้คุณสมบัติทั้งหมดเพื่อพัฒนาต้นไม้ เมื่อสามารถสุ่มต้นไม้ได้หลายต้น จะเรียกว่าสุ่มป่า

การบรรจุถุงยังได้รับการใช้ประโยชน์จากโมเดลการเรียนรู้เชิงลึกในตลาดการเงิน ทำให้ฟังก์ชันที่สำคัญเป็นอัตโนมัติ เช่น การตรวจจับการฉ้อโกง การคำนวณความเสี่ยงด้านเครดิต และปัญหาการกำหนดราคาออปชั่น

งานวิจัยชิ้นนี้แสดงให้เห็นว่าการใช้ประโยชน์จากเทคนิคแมชชีนเลิร์นนิงหลายแบบเพื่อสร้างความเสี่ยงในการผิดนัดชำระหนี้ การศึกษานี้เข้าใจวิธีที่การบรรจุถุงช่วยลดความเสี่ยงด้วยการหลีกเลี่ยงการฉ้อโกงบัตรเครดิตภายในธนาคารและสถาบันการเงิน

กำลังเสริม

การเร่งความเร็วเป็นอีกกระบวนการหนึ่งในการสร้างชุดตัวทำนาย ในอีกแง่หนึ่ง มันสามารถใส่ต้นไม้ที่ต่อเนื่องกัน โดยทั่วไปแล้วจะสุ่มตัวอย่าง และในทุกเฟส วัตถุประสงค์คือการแก้ไขข้อผิดพลาดสุทธิจากต้นไม้ก่อนหน้า

โดยทั่วไปแล้วการส่งเสริมจะใช้เพื่อลดอคติและความแปรปรวนในเทคนิคการเรียนรู้ภายใต้การดูแล กำหนดกลุ่มของอัลกอริธึมที่เปลี่ยนผู้เรียนที่อ่อนแอ (ผู้เรียนพื้นฐาน) ให้เป็นผู้เรียนที่เข้มแข็ง ผู้เรียนที่อ่อนแอคือตัวแยกประเภทที่ถูกต้องเพียงเล็กน้อยกับการจัดหมวดหมู่จริง ในขณะที่ผู้เรียนที่เข้มแข็งคือตัวแยกประเภทที่มีความสัมพันธ์ที่ดีกับการจัดหมวดหมู่จริง

ให้เราดูการเปรียบเทียบระหว่าง Bagging และ Boosting

การบรรจุ กำลังเสริม
วัตถุประสงค์เพื่อลดความแปรปรวน ไม่ใช่อคติ วัตถุประสงค์เพื่อลดอคติ ไม่ใช่ความแปรปรวน
แต่ละรุ่นถูกสร้างขึ้นอย่างอิสระ โมเดลใหม่ได้รับผลกระทบจากการใช้งานโมเดลที่พัฒนาก่อนหน้านี้
เป็นวิธีที่ง่ายที่สุดในการเชื่อมโยงการคาดคะเนที่เป็นประเภทเดียวกัน เป็นวิธีการเชื่อมคำทำนายที่เป็นของหลายประเภท
การบรรจุถุงพยายามที่จะแก้ไขปัญหาการใส่มากเกินไป การบูสต์พยายามลดความลำเอียง
ชุดย่อยข้อมูลการฝึกหลายชุดจะถูกสุ่มโดยแทนที่จากชุดข้อมูลการฝึกทั้งหมด ชุดย่อยใหม่แต่ละชุดประกอบด้วยส่วนประกอบที่จัดประเภทผิดโดยรุ่นก่อนหน้า
การบรรจุถุงสามารถแก้ปัญหาการใส่มากเกินไปได้ การบูสต์สามารถเพิ่มปัญหาการใส่มากเกินไปได้