Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์
สามารถแสดงเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel ได้
สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ -
pd.Dataframe(data, index, columns, dtype, copy)
'data', 'index', 'columns', 'dtype' และ 'copy' ไม่ใช่ค่าบังคับ
รายการพจนานุกรมสามารถส่งผ่านเป็นอินพุตไปยังดาต้าเฟรมได้ คีย์ของพจนานุกรมจะใช้เป็นชื่อคอลัมน์โดยค่าเริ่มต้น เรามาดูตัวอย่างกัน −
ตัวอย่าง
import pandas as pd my_data = [{'ab' : 34}, {'mn' : 56},{ 'gh' : 78}, {'wq' : 90},{'az' : 123},{'kl' : 45}] my_df = pd.DataFrame(my_data) print("The dataframe created from list of dictionary : ") print(my_df)
ผลลัพธ์
The dataframe created from list of dictionary : ab az gh kl mn wq 0 34.0 NaN NaN NaN NaN NaN 1 NaN NaN NaN NaN 56.0 NaN 2 NaN NaN 78.0 NaN NaN NaN 3 NaN NaN NaN NaN NaN 90.0 4 NaN 123.0 NaN NaN NaN NaN 5 NaN NaN NaN 45.0 NaN NaN
คำอธิบาย
-
ไลบรารีที่จำเป็นจะถูกนำเข้า และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
-
รายการค่าพจนานุกรมจะถูกสร้างขึ้น โดยมีคู่คีย์-ค่าอยู่ในพจนานุกรมเดียว
-
ด้วยวิธีนี้ พจนานุกรมหลายชุดจึงถูกสร้างขึ้นและจัดเก็บไว้ในรายการ
-
รายการพจนานุกรมนี้จะถูกส่งต่อไปเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
-
ดาต้าเฟรมถูกสร้างขึ้นโดยส่งรายการค่าพจนานุกรมเป็นพารามิเตอร์ไป
-
พิมพ์ดาต้าเฟรมบนคอนโซล
หมายเหตุ − คำว่า 'NaN' หมายถึง 'ไม่ใช่ตัวเลข' ซึ่งหมายความว่าค่า [row,col] เฉพาะไม่มีรายการที่ถูกต้อง