เราสามารถใช้ .corr() วิธีรับความสัมพันธ์ระหว่างสองคอลัมน์ใน Pandas มาดูตัวอย่างวิธีการใช้วิธีนี้กัน
ขั้นตอน
- สร้างข้อมูลตารางแบบสองมิติ ปรับขนาดได้ และอาจต่างกันได้ df .
- พิมพ์ DataFrame อินพุต df .
- เริ่มต้นสองตัวแปร col1 และ col2 และกำหนดคอลัมน์ที่คุณต้องการค้นหาความสัมพันธ์
- ค้นหาความสัมพันธ์ระหว่าง col1 และ col2 โดยใช้ df[col1].corr(df[col2]) และบันทึกค่าสหสัมพันธ์ในตัวแปร corr.
- พิมพ์ค่าสหสัมพันธ์ที่ถูกต้อง
ตัวอย่าง
import pandas as pd df = pd.DataFrame( { "x": [5, 2, 7, 0], "y": [4, 7, 5, 1], "z": [9, 3, 5, 1] } ) print "Input DataFrame is:\n", df col1, col2 = "x", "y" corr = df[col1].corr(df[col2]) print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2) col1, col2 = "x", "x" corr = df[col1].corr(df[col2]) print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2) col1, col2 = "x", "z" corr = df[col1].corr(df[col2]) print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2) col1, col2 = "y", "x" corr = df[col1].corr(df[col2]) print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2)
ผลลัพธ์
Input DataFrame is: x y z 0 5 4 9 1 2 7 3 2 7 5 5 3 0 1 1 Correlation between x and y is: 0.41 Correlation between x and x is: 1.0 Correlation between x and z is: 0.72 Correlation between y and x is: 0.41