ส่วนเบี่ยงเบนมาตรฐานจะบอกถึงวิธีการกระจายค่าในชุดข้อมูล และยังบอกด้วยว่าค่าในชุดข้อมูลอยู่ห่างจากค่าเฉลี่ยเลขคณิตของคอลัมน์ในชุดข้อมูลมากเพียงใด
บางครั้ง อาจจำเป็นต้องได้รับค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะที่เป็นตัวเลข นี่คือจุดที่สามารถใช้ฟังก์ชัน std() ได้ คอลัมน์ที่ต้องการคำนวณค่าเฉลี่ยสามารถจัดทำดัชนีไปยังดาต้าเฟรม และสามารถเรียกใช้ฟังก์ชันค่าเฉลี่ยได้โดยใช้ตัวดำเนินการจุด
นอกจากนี้ยังสามารถส่งผ่านดัชนีของคอลัมน์เพื่อค้นหาค่าเบี่ยงเบนมาตรฐานได้
ให้เราดูการสาธิตของสิ่งเดียวกัน -
ตัวอย่าง
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The standard deviation of column 'Age' is :") print(my_df['Age'].std()) print("The standard deviation of column 'value' is :") print(my_df['value'].std())
ผลลัพธ์
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The standard deviation of column 'Age' is : 31.499206339207976 The standard deviation of column 'value' is : 35.747101700697364
คำอธิบาย
-
ไลบรารีที่จำเป็นจะถูกนำเข้าและให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
-
พจนานุกรมของชุดข้อมูลที่ประกอบด้วยคีย์และค่าถูกสร้างขึ้น โดยที่ค่าจริง ๆ แล้วเป็นโครงสร้างข้อมูลชุดข้อมูล
-
พจนานุกรมนี้จะถูกส่งต่อไปเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
-
พิมพ์ดาต้าเฟรมบนคอนโซล
-
เรากำลังดูการคำนวณค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะที่มีค่าตัวเลขอยู่ในนั้น
-
ฟังก์ชัน 'std' ถูกเรียกใช้บน dataframe โดยการระบุชื่อของคอลัมน์ โดยใช้ตัวดำเนินการจุด
-
ค่าเบี่ยงเบนมาตรฐานของคอลัมน์ตัวเลขถูกพิมพ์บนคอนโซล