เราสามารถใช้ pandas.DataFrame.corr เพื่อคำนวณความสัมพันธ์แบบคู่ของคอลัมน์ โดยไม่รวมค่า NULL ค่าสัมประสิทธิ์สหสัมพันธ์บ่งบอกถึงความแข็งแกร่งของความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ค่าสัมประสิทธิ์อยู่ระหว่าง -1 ถึง 1
เพื่อให้ได้ความสัมพันธ์ระหว่างคอลัมน์ตัวเลขสองคอลัมน์ในดาต้าเฟรมของ Pandas เราสามารถทำตามขั้นตอนต่อไปนี้ -
- กำหนดขนาดรูปและปรับช่องว่างภายในระหว่างและรอบๆ แผนผังย่อย
- สร้างดาต้าเฟรม Pandas ของข้อมูลตารางสองมิติ ปรับขนาดได้ และอาจต่างกันได้
- เปรียบเทียบค่าของทั้งสองคอลัมน์และคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้ col1.corr(col2)
- พิมพ์ค่าสัมประสิทธิ์สหสัมพันธ์บนคอนโซล
- หากต้องการแสดงรูป ให้ใช้ show() วิธีการ
ตัวอย่าง
import pandas as pd
from matplotlib import pyplot as plt
plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True
df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})
col1 = df['lab']
col2 = df['value']
plt.plot(col1, col2)
print("The correlation coefficient is: ", col1.corr(col2))
plt.show() ผลลัพธ์
มันจะสร้างผลลัพธ์ต่อไปนี้
The correlation coefficient is: 1.0

ในที่นี้ค่าสัมประสิทธิ์สหสัมพันธ์คือ 1.0 ซึ่งบ่งชี้ถึงความสัมพันธ์ที่สมบูรณ์แบบ ดังนั้นเราจึงได้เส้นตรงเพราะทุกจุดอยู่ในแนวเส้นตรง