สามารถรับข้อมูลจำนวนมากเกี่ยวกับข้อมูลได้โดยใช้ฟังก์ชันต่างๆ แต่ถ้าเราต้องการรับข้อมูลทั้งหมดเกี่ยวกับข้อมูล สามารถใช้ฟังก์ชัน 'อธิบาย' ได้
ฟังก์ชันนี้จะให้ข้อมูล เช่น "จำนวน" "ค่าเฉลี่ย" "ค่าเบี่ยงเบนมาตรฐาน" เปอร์เซ็นไทล์ที่ 25 เปอร์เซ็นไทล์ที่ 50 และเปอร์เซ็นไทล์ที่ 75
ตัวอย่าง
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The description of data is :") print(my_df.describe())
ผลลัพธ์
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The description of data is : Age value count 5.000000 5.000000 mean 47.200000 46.554000 std 31.499206 35.747102 min 12.000000 8.790000 25% 23.000000 23.240000 50% 45.000000 31.980000 75% 67.000000 78.560000 max 89.000000 90.200000
คำอธิบาย
- นำเข้าไลบรารีที่จำเป็น และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
- พจนานุกรมของชุดข้อมูลที่ประกอบด้วยคีย์และค่าถูกสร้างขึ้น โดยที่ค่าจริง ๆ แล้วเป็นโครงสร้างข้อมูลของชุดข้อมูล
- พจนานุกรมนี้ถูกส่งต่อมาเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
- พิมพ์ dataframe บนคอนโซล
- เรากำลังดูข้อมูลทั้งหมดที่เกี่ยวกับข้อมูล
- มีการเรียกใช้ฟังก์ชัน 'อธิบาย' บนดาต้าเฟรม
- คำอธิบายถูกพิมพ์บนคอนโซล