Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

สรุปข้อมูลใน Pandas Python ได้อย่างไร


สามารถรับข้อมูลจำนวนมากเกี่ยวกับข้อมูลได้โดยใช้ฟังก์ชันต่างๆ แต่ถ้าเราต้องการรับข้อมูลทั้งหมดเกี่ยวกับข้อมูล สามารถใช้ฟังก์ชัน 'อธิบาย' ได้

ฟังก์ชันนี้จะให้ข้อมูล เช่น "จำนวน" "ค่าเฉลี่ย" "ค่าเบี่ยงเบนมาตรฐาน" เปอร์เซ็นไทล์ที่ 25 เปอร์เซ็นไทล์ที่ 50 และเปอร์เซ็นไทล์ที่ 75

ตัวอย่าง

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The description of data is :")
print(my_df.describe())

ผลลัพธ์

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The description of data is :
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

คำอธิบาย

  • นำเข้าไลบรารีที่จำเป็น และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
  • พจนานุกรมของชุดข้อมูลที่ประกอบด้วยคีย์และค่าถูกสร้างขึ้น โดยที่ค่าจริง ๆ แล้วเป็นโครงสร้างข้อมูลของชุดข้อมูล
  • พจนานุกรมนี้ถูกส่งต่อมาเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
  • พิมพ์ dataframe บนคอนโซล
  • เรากำลังดูข้อมูลทั้งหมดที่เกี่ยวกับข้อมูล
  • มีการเรียกใช้ฟังก์ชัน 'อธิบาย' บนดาต้าเฟรม
  • คำอธิบายถูกพิมพ์บนคอนโซล