Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

การถดถอยในการทำเหมืองข้อมูลมีกี่ประเภท?


การถดถอยกำหนดประเภทของวิธีการเรียนรู้ของเครื่องภายใต้การดูแลที่สามารถใช้เพื่อคาดการณ์แอตทริบิวต์ที่มีมูลค่าต่อเนื่องได้ การถดถอยช่วยให้องค์กรธุรกิจบางแห่งสามารถสำรวจความสัมพันธ์ของตัวแปรเป้าหมายและตัวทำนาย เป็นเครื่องมือสำคัญในการสำรวจข้อมูลที่สามารถใช้สำหรับการคาดการณ์ทางการเงินและการสร้างแบบจำลองอนุกรมเวลา

การถดถอยมีหลายประเภทดังนี้ −

การถดถอยเชิงเส้น − การถดถอยเชิงเส้นรวมถึงการค้นหาเส้นที่ "ดีที่สุด" เพื่อให้พอดีกับสองแอตทริบิวต์ (หรือตัวแปร) ดังนั้นแอตทริบิวต์หนึ่งจึงสามารถใช้ทำนายแอตทริบิวต์อื่นได้ การถดถอยเชิงเส้นพหุคูณเป็นความก้าวหน้าของการถดถอยเชิงเส้น โดยที่รวมแอตทริบิวต์ที่สูงกว่าสองรายการไว้และบันทึกจะพอดีกับพื้นที่หลายมิติ

ตัวอย่างเช่น สมการคือ

Y = a + b*X + e.

ที่ไหน

a กำหนดจุดตัด

b กำหนดความชันของเส้นถดถอย

e กำหนดข้อผิดพลาด

X และ Y กำหนดตัวทำนายและตัวแปรเป้าหมายตามลำดับ หาก X ถูกสร้างขึ้นจากตัวแปรมากกว่าหนึ่งตัว ให้กำหนดเป็นสมการเชิงเส้นหลายตัว

ในการถดถอยเชิงเส้น เส้นที่พอดีที่สุดถูกนำมาใช้โดยใช้วิธีกำลังสองน้อยที่สุด และจะลดผลรวมทั้งหมดของกำลังสองของการเบี่ยงเบนจากจุดข้อมูลทุกจุดไปยังเส้นถดถอย ดังนั้น ค่าเบี่ยงเบนบวกและค่าลบจึงไม่ถูกยกเลิก เนื่องจากค่าเบี่ยงเบนบางส่วนถูกยกกำลังสอง

การถดถอยพหุนาม − หากกำลังของตัวแปรแยกกันมากกว่า 1 ในสมการถดถอย จะถูกกำหนดเป็นสมการพหุนาม

ตัวอย่างเช่น สมการคือ

Y = a + b * x2

ในการถดถอยจำเพาะ เส้นที่พอดีที่สุดจะไม่ถือว่าเป็นเส้นตรง เช่น สมการเชิงเส้น แต่จะกำหนดเส้นโค้งที่พอดีกับจุดข้อมูลบางจุด

โลจิสติกถดถอย − เมื่อตัวแปรตามเป็นไบนารีในลักษณะเช่น 0 และ 1 จริงหรือเท็จ สำเร็จหรือล้มเหลว วิธีการถดถอยโลจิสติกจะปรากฏขึ้น ดังนั้น ค่าเป้าหมาย (Y) จึงอยู่ในช่วงตั้งแต่ 0 ถึง 1 และโดยทั่วไปจะใช้สำหรับปัญหาตามการจัดประเภท ต่างจากการถดถอยเชิงเส้นตรงที่ไม่ต้องการตัวแปรอิสระและตัวแปรตามบางตัวเพื่อให้มีความสัมพันธ์เชิงเส้น

การถดถอยของสันเขา − Ridge regression กำหนดกระบวนการที่สามารถใช้ในการคำนวณข้อมูลการถดถอยต่างๆ ที่มีปัญหา multicollinearity Multicollinearity คือความต่อเนื่องของความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัวที่แยกจากกัน

การถดถอยแบบ Lasso − LASSO แสดงถึงการหดตัวน้อยที่สุดและตัวดำเนินการคัดเลือก การถดถอยแบบ Lasso เป็นวิธีการถดถอยเชิงเส้นที่ใช้การหดตัว ในการถดถอยแบบ Lasso จุดข้อมูลบางจุดจะถูกย่อไปยังจุดศูนย์กลาง หรือที่เรียกว่าค่าเฉลี่ย ขั้น ตอน lasso เหมาะที่สุดสำหรับแบบจำลองที่เรียบง่ายและเบาบางซึ่งมีพารามิเตอร์หลายอย่างมากกว่าการถดถอยแบบอื่น วิธีการถดถอยนี้เหมาะอย่างยิ่งสำหรับตัวแบบที่ทนจากหลายเส้นตรง