Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

ความสัมพันธ์ระหว่างสองคอลัมน์ตัวเลขใน Pandas DataFrame


เราสามารถใช้ pandas.DataFrame.corr เพื่อคำนวณความสัมพันธ์แบบคู่ของคอลัมน์ โดยไม่รวมค่า NULL ค่าสัมประสิทธิ์สหสัมพันธ์บ่งบอกถึงความแข็งแกร่งของความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ค่าสัมประสิทธิ์อยู่ระหว่าง -1 ถึง 1

เพื่อให้ได้ความสัมพันธ์ระหว่างคอลัมน์ตัวเลขสองคอลัมน์ในดาต้าเฟรมของ Pandas เราสามารถทำตามขั้นตอนต่อไปนี้ -

  • กำหนดขนาดรูปและปรับช่องว่างภายในระหว่างและรอบๆ แผนผังย่อย
  • สร้างดาต้าเฟรม Pandas ของข้อมูลตารางสองมิติ ปรับขนาดได้ และอาจต่างกันได้
  • เปรียบเทียบค่าของทั้งสองคอลัมน์และคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้ col1.corr(col2)
  • พิมพ์ค่าสัมประสิทธิ์สหสัมพันธ์บนคอนโซล
  • หากต้องการแสดงรูป ให้ใช้ show() วิธีการ

ตัวอย่าง

import pandas as pd
from matplotlib import pyplot as plt

plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True

df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})

col1 = df['lab']
col2 = df['value']

plt.plot(col1, col2)

print("The correlation coefficient is: ", col1.corr(col2))

plt.show()

ผลลัพธ์

มันจะสร้างผลลัพธ์ต่อไปนี้

The correlation coefficient is: 1.0

ความสัมพันธ์ระหว่างสองคอลัมน์ตัวเลขใน Pandas DataFrame ความสัมพันธ์ระหว่างสองคอลัมน์ตัวเลขใน Pandas DataFrame

ในที่นี้ค่าสัมประสิทธิ์สหสัมพันธ์คือ 1.0 ซึ่งบ่งชี้ถึงความสัมพันธ์ที่สมบูรณ์แบบ ดังนั้นเราจึงได้เส้นตรงเพราะทุกจุดอยู่ในแนวเส้นตรง