เราสามารถใช้ pandas.DataFrame.corr เพื่อคำนวณความสัมพันธ์แบบคู่ของคอลัมน์ โดยไม่รวมค่า NULL ค่าสัมประสิทธิ์สหสัมพันธ์บ่งบอกถึงความแข็งแกร่งของความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ค่าสัมประสิทธิ์อยู่ระหว่าง -1 ถึง 1
เพื่อให้ได้ความสัมพันธ์ระหว่างคอลัมน์ตัวเลขสองคอลัมน์ในดาต้าเฟรมของ Pandas เราสามารถทำตามขั้นตอนต่อไปนี้ -
- กำหนดขนาดรูปและปรับช่องว่างภายในระหว่างและรอบๆ แผนผังย่อย
- สร้างดาต้าเฟรม Pandas ของข้อมูลตารางสองมิติ ปรับขนาดได้ และอาจต่างกันได้
- เปรียบเทียบค่าของทั้งสองคอลัมน์และคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้ col1.corr(col2)
- พิมพ์ค่าสัมประสิทธิ์สหสัมพันธ์บนคอนโซล
- หากต้องการแสดงรูป ให้ใช้ show() วิธีการ
ตัวอย่าง
import pandas as pd from matplotlib import pyplot as plt plt.rcParams["figure.figsize"] = [7.00, 3.50] plt.rcParams["figure.autolayout"] = True df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]}) col1 = df['lab'] col2 = df['value'] plt.plot(col1, col2) print("The correlation coefficient is: ", col1.corr(col2)) plt.show()
ผลลัพธ์
มันจะสร้างผลลัพธ์ต่อไปนี้
The correlation coefficient is: 1.0
ในที่นี้ค่าสัมประสิทธิ์สหสัมพันธ์คือ 1.0 ซึ่งบ่งชี้ถึงความสัมพันธ์ที่สมบูรณ์แบบ ดังนั้นเราจึงได้เส้นตรงเพราะทุกจุดอยู่ในแนวเส้นตรง