ความสัมพันธ์หมายถึงความสัมพันธ์ทางสถิติบางอย่างที่เกี่ยวข้องกับการพึ่งพากันระหว่างชุดข้อมูลสองชุด ในขณะที่การถดถอยเชิงเส้นเป็นแนวทางเชิงเส้นเพื่อสร้างความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระอย่างน้อยหนึ่งตัว ตัวแปรอิสระตัวเดียวเรียกว่าการถดถอยเชิงเส้นในขณะที่ตัวแปรอิสระหลายตัวเรียกว่าการถดถอยพหุคูณ
ความสัมพันธ์
ตัวอย่างง่ายๆ ของปรากฏการณ์ที่ต้องพึ่งพาอาศัยกัน ได้แก่ ความสัมพันธ์ระหว่างลักษณะทางกายภาพของพ่อแม่กับลูก และความสัมพันธ์ระหว่างราคาของผลิตภัณฑ์กับปริมาณที่จัดหา เรานำตัวอย่างชุดข้อมูลม่านตาที่มีอยู่ในไลบรารี Seaborn python ในนั้นเราพยายามสร้างความสัมพันธ์ระหว่างความยาวและความกว้างของกลีบเลี้ยงและกลีบของดอกไอริสสามสายพันธุ์ จากความสัมพันธ์ที่ค้นพบ สามารถสร้างแบบจำลองที่แข็งแกร่งซึ่งแยกแยะสายพันธุ์หนึ่งจากอีกสายพันธุ์หนึ่งได้อย่างง่ายดาย
ตัวอย่าง
import matplotlib.pyplot as plt import seaborn as sns df = sns.load_dataset('iris') #without regression sns.pairplot(df, kind="scatter") plt.show()
ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
การถดถอยเชิงเส้น
ความสัมพันธ์เชิงเส้นเชิงคณิตศาสตร์แสดงถึงเส้นตรงเมื่อพล็อตเป็นกราฟ ความสัมพันธ์แบบไม่เชิงเส้นโดยที่เลขชี้กำลังของตัวแปรใดๆ ไม่เท่ากับ 1 จะสร้างเส้นโค้ง ฟังก์ชันใน Seaborn เพื่อค้นหาความสัมพันธ์ของการถดถอยเชิงเส้นคือ regplot ตัวอย่างด้านล่างแสดงการใช้งาน
ตัวอย่าง
import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('tips') sb.regplot(x = "total_bill", y = "tip", data = df) plt.show()
ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -