บางครั้ง อาจจำเป็นต้องได้รับค่าเฉลี่ยของคอลัมน์เฉพาะ หรือค่ากลางของคอลัมน์ทั้งหมดที่มีค่าตัวเลข นี่คือจุดที่สามารถใช้ฟังก์ชัน mean() ได้
คำว่า "ค่าเฉลี่ย" หมายถึงการหาผลรวมของค่าทั้งหมดและหารด้วยจำนวนค่าทั้งหมดในชุดข้อมูล
ให้เราดูการสาธิตของสิ่งเดียวกัน -
ตัวอย่าง
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]), 'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The mean is :") print(my_df.mean())
ผลลัพธ์
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The mean is : Age 47.200 value 46.554 dtype: float64
คำอธิบาย
-
ไลบรารีที่จำเป็นจะถูกนำเข้า และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
-
พจนานุกรมของชุดข้อมูลที่ประกอบด้วยคีย์และค่าถูกสร้างขึ้น โดยที่ค่าจริง ๆ แล้วเป็นโครงสร้างข้อมูลชุดข้อมูล
-
พจนานุกรมนี้จะถูกส่งต่อไปเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
-
พิมพ์ดาต้าเฟรมบนคอนโซล
-
เรากำลังดูการคำนวณค่าเฉลี่ยของคอลัมน์ทั้งหมดที่มีค่าตัวเลขอยู่ในนั้น
-
ฟังก์ชัน 'mean' ถูกเรียกใช้บนดาต้าเฟรมโดยใช้ตัวดำเนินการจุด
-
ค่าเฉลี่ยของคอลัมน์ตัวเลขถูกพิมพ์บนคอนโซล