Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การถดถอยคืออะไร?


การถดถอยกำหนดประเภทของวิธีการเรียนรู้ของเครื่องภายใต้การดูแลที่สามารถใช้เพื่อคาดการณ์แอตทริบิวต์ที่มีมูลค่าต่อเนื่องได้ การถดถอยช่วยให้องค์กรธุรกิจบางแห่งสามารถสำรวจความสัมพันธ์ของตัวแปรเป้าหมายและตัวทำนาย เป็นเครื่องมือสำคัญในการสำรวจข้อมูลที่สามารถใช้สำหรับการคาดการณ์ทางการเงินและการสร้างแบบจำลองอนุกรมเวลา

ข้อมูลสามารถปรับให้เรียบได้โดยการปรับข้อมูลให้เข้ากับฟังก์ชัน เช่น ด้วยการถดถอย การถดถอยเชิงเส้นรวมถึงการค้นหาเส้นที่ "ดีที่สุด" เพื่อให้พอดีกับสองแอตทริบิวต์ (หรือตัวแปร) ดังนั้นแอตทริบิวต์หนึ่งสามารถใช้เพื่อคาดการณ์แอตทริบิวต์อื่นได้ การถดถอยเชิงเส้นหลายครั้งเป็นความก้าวหน้าของการถดถอยเชิงเส้น ซึ่งรวมแอตทริบิวต์ที่สูงกว่า 2 รายการและข้อมูลจะพอดีกับสเปซหลายมิติ

ในการถดถอยเชิงเส้น ข้อมูลจะถูกจำลองให้พอดีกับเส้นตรง ตัวอย่างเช่น ตัวแปรสุ่ม y (เรียกว่า ตัวแปรตอบสนอง) สามารถจำลองเป็นฟังก์ชันเชิงเส้นของตัวแปรสุ่มอื่น x (เรียกว่าตัวแปรทำนาย) ด้วยสมการ y =wx+b โดยที่ค่าความแปรปรวนของ y จะถูกนำมาพิจารณา ให้คงที่

ปัญหาการถดถอยจัดการกับการคำนวณค่าเอาต์พุตที่วางบนค่าอินพุต เมื่อใช้สำหรับการจัดประเภท ค่าอินพุตคือค่าจากฐานข้อมูล และค่าเอาต์พุตแสดงถึงคลาส การถดถอยสามารถใช้เพื่อสำรวจปัญหาการจำแนกประเภท แต่สามารถใช้ได้กับหลายแอปพลิเคชัน เช่น การพยากรณ์ โครงสร้างพื้นฐานของการถดถอยคือการถดถอยเชิงเส้นอย่างง่ายที่มีเพียงหนึ่งตัวทำนายและการทำนาย

สามารถใช้การถดถอยเพื่อจำแนกประเภทได้โดยใช้สองวิธีดังต่อไปนี้ −

  • ดิวิชั่น − ข้อมูลจะถูกแบ่งออกเป็นภูมิภาคที่อยู่ในชั้นเรียน

  • การทำนาย − สูตรถูกสร้างขึ้นเพื่อทำนายมูลค่าของคลาสเอาต์พุต

วิธีการเหล่านี้ใช้เพื่อทำนายค่าของตัวแปรตอบสนอง (ขึ้นกับ) จากตัวแปรทำนาย (อิสระ) หนึ่งตัวหรือมากกว่าโดยที่ตัวแปรเป็นจำนวนเต็ม การถดถอยมีหลายรูปแบบ เช่น เชิงเส้น พหุคูณ ถ่วงน้ำหนัก พหุนาม ไม่มีพารามิเตอร์ และแข็งแกร่ง (เทคนิคที่มีประสิทธิภาพจะมีประโยชน์เมื่อข้อผิดพลาดไม่ต้องการสภาวะปกติหรือเมื่อข้อมูลมีค่าผิดปกติที่มีนัยสำคัญ)

การถดถอยสามารถทำนายชุดข้อมูลที่ขึ้นต่อกันบางชุด ซึ่งกำหนดไว้ในนิพจน์ของตัวแปรที่แยกจากกัน และแนวโน้มสามารถเข้าถึงได้ในช่วงเวลาที่แน่นอน การถดถอยสนับสนุนวิธีการที่ดีในการทำนายตัวแปร แต่มีข้อจำกัดและสมมติฐานเฉพาะ เช่น ความเป็นอิสระของตัวแปร การแจกแจงแบบปกติโดยธรรมชาติของตัวแปร

ใบไม้ต้นไม้การถดถอยแต่ละต้นเก็บการคาดคะเนที่มีมูลค่าอย่างต่อเนื่อง ซึ่งเป็นต้นทุนเฉลี่ยของแอตทริบิวต์ที่คาดการณ์ไว้สำหรับชุดการฝึกที่ครอบคลุมใบไม้ ในทางตรงกันข้าม ในต้นไม้แบบจำลอง ใบไม้แต่ละใบมีแนวโน้มที่จะใช้แบบจำลองการถดถอยและสมการต่อเนื่องหลายตัวแปรสำหรับแอตทริบิวต์ที่คาดการณ์ไว้ ต้นไม้การถดถอยและแบบจำลองมีอิทธิพลต่อประสิทธิภาพมากกว่าการถดถอยเชิงเส้นเมื่อแบบจำลองเชิงเส้นอย่างง่ายแสดงข้อมูลได้ไม่ดี