Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

จะค้นหาค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะใน dataframe ใน Pandas Python ได้อย่างไร


ส่วนเบี่ยงเบนมาตรฐานจะบอกถึงวิธีการกระจายค่าในชุดข้อมูล และยังบอกด้วยว่าค่าในชุดข้อมูลอยู่ห่างจากค่าเฉลี่ยเลขคณิตของคอลัมน์ในชุดข้อมูลมากเพียงใด

บางครั้ง อาจจำเป็นต้องได้รับค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะที่เป็นตัวเลข นี่คือจุดที่สามารถใช้ฟังก์ชัน std() ได้ คอลัมน์ที่ต้องการคำนวณค่าเฉลี่ยสามารถจัดทำดัชนีไปยังดาต้าเฟรม และสามารถเรียกใช้ฟังก์ชันค่าเฉลี่ยได้โดยใช้ตัวดำเนินการจุด

นอกจากนี้ยังสามารถส่งผ่านดัชนีของคอลัมน์เพื่อค้นหาค่าเบี่ยงเบนมาตรฐานได้

ให้เราดูการสาธิตของสิ่งเดียวกัน -

ตัวอย่าง

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The standard deviation of column 'Age' is :")
print(my_df['Age'].std())
print("The standard deviation of column 'value' is :")
print(my_df['value'].std())

ผลลัพธ์

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The standard deviation of column 'Age' is :
31.499206339207976
The standard deviation of column 'value' is :
35.747101700697364

คำอธิบาย

  • ไลบรารีที่จำเป็นจะถูกนำเข้าและให้ชื่อแทนเพื่อความสะดวกในการใช้งาน

  • พจนานุกรมของชุดข้อมูลที่ประกอบด้วยคีย์และค่าถูกสร้างขึ้น โดยที่ค่าจริง ๆ แล้วเป็นโครงสร้างข้อมูลชุดข้อมูล

  • พจนานุกรมนี้จะถูกส่งต่อไปเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'

  • พิมพ์ดาต้าเฟรมบนคอนโซล

  • เรากำลังดูการคำนวณค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะที่มีค่าตัวเลขอยู่ในนั้น

  • ฟังก์ชัน 'std' ถูกเรียกใช้บน dataframe โดยการระบุชื่อของคอลัมน์ โดยใช้ตัวดำเนินการจุด

  • ค่าเบี่ยงเบนมาตรฐานของคอลัมน์ตัวเลขถูกพิมพ์บนคอนโซล