การบรรจุ
การบรรจุถุงเรียกอีกอย่างว่าการรวมบูตสแตรป เป็นวิธีการเรียนรู้ทั้งมวลที่ใช้โดยทั่วไปเพื่อลดความแปรปรวนภายในชุดข้อมูลที่มีเสียงดัง ในการบรรจุถุง ระบบจะเลือกตัวอย่างข้อมูลแบบสุ่มในชุดการฝึกโดยมีการแทนที่ ซึ่งหมายความว่าจะเลือกจุดข้อมูลเดียวได้มากกว่า 1 ครั้ง
หลังจากสร้างตัวอย่างข้อมูลหลายตัวอย่างแล้ว แบบจำลองที่อ่อนแอเหล่านี้จะได้รับการฝึกอบรมแยกกันและขึ้นอยู่กับองค์ประกอบของการถดถอยของงานหรือการจัดประเภท ตัวอย่างเช่น ค่าเฉลี่ยของการคาดการณ์เหล่านั้นให้ค่าประมาณที่มีประสิทธิภาพมากขึ้น
Random Forest เป็นส่วนขยายของการบรรจุถุง ต้องใช้อีกหนึ่งขั้นตอนในการคาดเดาชุดย่อยของเรคคอร์ดแบบสุ่ม นอกจากนี้ยังสร้างการสุ่มเลือกคุณสมบัติแทนที่จะใช้คุณสมบัติทั้งหมดเพื่อพัฒนาต้นไม้ เมื่อสามารถสุ่มต้นไม้ได้หลายต้น จะเรียกว่าสุ่มป่า
การบรรจุถุงยังได้รับการใช้ประโยชน์จากโมเดลการเรียนรู้เชิงลึกในตลาดการเงิน ทำให้ฟังก์ชันที่สำคัญเป็นอัตโนมัติ เช่น การตรวจจับการฉ้อโกง การคำนวณความเสี่ยงด้านเครดิต และปัญหาการกำหนดราคาออปชั่น
งานวิจัยชิ้นนี้แสดงให้เห็นว่าการใช้ประโยชน์จากเทคนิคแมชชีนเลิร์นนิงหลายแบบเพื่อสร้างความเสี่ยงในการผิดนัดชำระหนี้ การศึกษานี้เข้าใจวิธีที่การบรรจุถุงช่วยลดความเสี่ยงด้วยการหลีกเลี่ยงการฉ้อโกงบัตรเครดิตภายในธนาคารและสถาบันการเงิน
กำลังเสริม
การเร่งความเร็วเป็นอีกกระบวนการหนึ่งในการสร้างชุดตัวทำนาย ในอีกแง่หนึ่ง มันสามารถใส่ต้นไม้ที่ต่อเนื่องกัน โดยทั่วไปแล้วจะสุ่มตัวอย่าง และในทุกเฟส วัตถุประสงค์คือการแก้ไขข้อผิดพลาดสุทธิจากต้นไม้ก่อนหน้า
โดยทั่วไปแล้วการส่งเสริมจะใช้เพื่อลดอคติและความแปรปรวนในเทคนิคการเรียนรู้ภายใต้การดูแล กำหนดกลุ่มของอัลกอริธึมที่เปลี่ยนผู้เรียนที่อ่อนแอ (ผู้เรียนพื้นฐาน) ให้เป็นผู้เรียนที่เข้มแข็ง ผู้เรียนที่อ่อนแอคือตัวแยกประเภทที่ถูกต้องเพียงเล็กน้อยกับการจัดหมวดหมู่จริง ในขณะที่ผู้เรียนที่เข้มแข็งคือตัวแยกประเภทที่มีความสัมพันธ์ที่ดีกับการจัดหมวดหมู่จริง
ให้เราดูการเปรียบเทียบระหว่าง Bagging และ Boosting
การบรรจุ | กำลังเสริม |
---|---|
วัตถุประสงค์เพื่อลดความแปรปรวน ไม่ใช่อคติ | วัตถุประสงค์เพื่อลดอคติ ไม่ใช่ความแปรปรวน |
แต่ละรุ่นถูกสร้างขึ้นอย่างอิสระ | โมเดลใหม่ได้รับผลกระทบจากการใช้งานโมเดลที่พัฒนาก่อนหน้านี้ |
เป็นวิธีที่ง่ายที่สุดในการเชื่อมโยงการคาดคะเนที่เป็นประเภทเดียวกัน | เป็นวิธีการเชื่อมคำทำนายที่เป็นของหลายประเภท |
การบรรจุถุงพยายามที่จะแก้ไขปัญหาการใส่มากเกินไป | การบูสต์พยายามลดความลำเอียง |
ชุดย่อยข้อมูลการฝึกหลายชุดจะถูกสุ่มโดยแทนที่จากชุดข้อมูลการฝึกทั้งหมด | ชุดย่อยใหม่แต่ละชุดประกอบด้วยส่วนประกอบที่จัดประเภทผิดโดยรุ่นก่อนหน้า |
การบรรจุถุงสามารถแก้ปัญหาการใส่มากเกินไปได้ | การบูสต์สามารถเพิ่มปัญหาการใส่มากเกินไปได้ |