Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

สหสัมพันธ์และการถดถอยใน Python


ความสัมพันธ์หมายถึงความสัมพันธ์ทางสถิติบางอย่างที่เกี่ยวข้องกับการพึ่งพากันระหว่างชุดข้อมูลสองชุด ในขณะที่การถดถอยเชิงเส้นเป็นแนวทางเชิงเส้นเพื่อสร้างความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระอย่างน้อยหนึ่งตัว ตัวแปรอิสระตัวเดียวเรียกว่าการถดถอยเชิงเส้นในขณะที่ตัวแปรอิสระหลายตัวเรียกว่าการถดถอยพหุคูณ

ความสัมพันธ์

ตัวอย่างง่ายๆ ของปรากฏการณ์ที่ต้องพึ่งพาอาศัยกัน ได้แก่ ความสัมพันธ์ระหว่างลักษณะทางกายภาพของพ่อแม่กับลูก และความสัมพันธ์ระหว่างราคาของผลิตภัณฑ์กับปริมาณที่จัดหา เรานำตัวอย่างชุดข้อมูลม่านตาที่มีอยู่ในไลบรารี Seaborn python ในนั้นเราพยายามสร้างความสัมพันธ์ระหว่างความยาวและความกว้างของกลีบเลี้ยงและกลีบของดอกไอริสสามสายพันธุ์ จากความสัมพันธ์ที่ค้นพบ สามารถสร้างแบบจำลองที่แข็งแกร่งซึ่งแยกแยะสายพันธุ์หนึ่งจากอีกสายพันธุ์หนึ่งได้อย่างง่ายดาย

ตัวอย่าง

import matplotlib.pyplot as plt
import seaborn as sns
df = sns.load_dataset('iris')
#without regression
sns.pairplot(df, kind="scatter")
plt.show()

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

สหสัมพันธ์และการถดถอยใน Python

การถดถอยเชิงเส้น

ความสัมพันธ์เชิงเส้นเชิงคณิตศาสตร์แสดงถึงเส้นตรงเมื่อพล็อตเป็นกราฟ ความสัมพันธ์แบบไม่เชิงเส้นโดยที่เลขชี้กำลังของตัวแปรใดๆ ไม่เท่ากับ 1 จะสร้างเส้นโค้ง ฟังก์ชันใน Seaborn เพื่อค้นหาความสัมพันธ์ของการถดถอยเชิงเส้นคือ regplot ตัวอย่างด้านล่างแสดงการใช้งาน

ตัวอย่าง

import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
sb.regplot(x = "total_bill", y = "tip", data = df)
plt.show()

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

สหสัมพันธ์และการถดถอยใน Python