Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

อะไรคือความแตกต่างระหว่างการถดถอยและการจำแนกประเภท?


การถดถอย

การถดถอยกำหนดประเภทของวิธีการเรียนรู้ของเครื่องภายใต้การดูแล ซึ่งสามารถใช้เพื่อคาดการณ์แอตทริบิวต์ที่มีค่าต่อเนื่องใดๆ การถดถอยช่วยให้องค์กรธุรกิจบางแห่งสามารถสำรวจความสัมพันธ์ของตัวแปรเป้าหมายและตัวทำนาย เป็นเครื่องมือสำคัญในการสำรวจข้อมูลที่สามารถใช้สำหรับการคาดการณ์ทางการเงินและการสร้างแบบจำลองอนุกรมเวลา

ข้อมูลสามารถปรับให้เรียบได้โดยการปรับข้อมูลให้เข้ากับฟังก์ชัน เช่น ด้วยการถดถอย การถดถอยเชิงเส้นรวมถึงการค้นหาเส้นที่ "ดีที่สุด" เพื่อให้พอดีกับสองแอตทริบิวต์ (หรือตัวแปร) ดังนั้นแอตทริบิวต์หนึ่งสามารถใช้เพื่อคาดการณ์แอตทริบิวต์อื่นได้ การถดถอยเชิงเส้นหลายครั้งเป็นความก้าวหน้าของการถดถอยเชิงเส้น ซึ่งรวมแอตทริบิวต์ที่สูงกว่า 2 รายการและข้อมูลจะพอดีกับสเปซหลายมิติ

ในการถดถอยเชิงเส้น ข้อมูลจะถูกจำลองให้พอดีกับเส้นตรง ตัวอย่างเช่น ตัวแปรสุ่ม y (เรียกว่า ตัวแปรตอบสนอง) สามารถจำลองเป็นฟังก์ชันเชิงเส้นของตัวแปรสุ่มอื่น x (เรียกว่าตัวแปรทำนาย) ด้วยสมการ y =wx+b โดยที่ค่าความแปรปรวนของ y จะถูกนำมาพิจารณา ให้คงที่

ปัญหาการถดถอยจัดการกับการคำนวณค่าเอาต์พุตที่วางบนค่าอินพุต เมื่อใช้สำหรับการจัดประเภท ค่าอินพุตคือค่าจากฐานข้อมูล และค่าเอาต์พุตแสดงถึงคลาส การถดถอยสามารถใช้เพื่อสำรวจปัญหาการจำแนกประเภท แต่สามารถใช้ได้กับหลายแอปพลิเคชัน เช่น การพยากรณ์ โครงสร้างพื้นฐานของการถดถอยคือการถดถอยเชิงเส้นอย่างง่ายที่มีเพียงหนึ่งตัวทำนายและการทำนาย

การจำแนกประเภท

การจัดประเภทเป็นขั้นตอนของการค้นหาแบบจำลองที่เป็นตัวแทนและแยกแยะชั้นข้อมูลหรือแนวคิด เพื่อวัตถุประสงค์ในการใช้แบบจำลองเพื่อทำนายคลาสของวัตถุที่มีป้ายชื่อชั้นไม่ระบุชื่อ โมเดลที่ได้รับจะขึ้นอยู่กับการวิเคราะห์กลุ่มของเร็กคอร์ดการฝึก (เช่น ออบเจ็กต์ข้อมูลที่มีป้ายกำกับคลาสที่คุ้นเคย)

ทูเพิลแต่ละตัวถือว่าอยู่ในคลาสที่กำหนดไว้ล่วงหน้า ตามที่กำหนดโดยหนึ่งในแอททริบิวต์ ที่เรียกว่าแอ็ตทริบิวต์ class label ในโครงสร้างของการจัดประเภท ทูเพิลข้อมูลจะแสดงเป็นตัวอย่าง ตัวอย่าง หรืออ็อบเจ็กต์ ทูเพิลข้อมูลวิเคราะห์เพื่อสร้างแบบจำลองโดยรวมจากชุดข้อมูลการฝึกอบรม ทูเพิลแต่ละตัวที่ประกอบเป็นชุดการฝึกจะแสดงเป็นตัวอย่างการฝึกและเลือกจากกลุ่มตัวอย่าง

เนื่องจากมีการระบุ class label ของตัวอย่างการฝึกอบรมทั้งหมด กระบวนการนี้จึงถูกกำหนดให้เป็นการเรียนรู้ภายใต้การดูแล ในการเรียนรู้แบบไม่มีผู้ดูแล โดยที่ฉลากชั้นเรียนของตัวอย่างการฝึกอบรมไม่ปรากฏชื่อ และไม่สามารถทราบชั้นเรียนต่างๆ ที่ต้องทำความเข้าใจล่วงหน้าได้