Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์
สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ -
pd.Dataframe(data, index, columns, dtype, copy)
ให้เราเข้าใจว่าสามารถสร้าง dataframe ได้อย่างไรโดยใช้พจนานุกรมของ Series
-
ซีรีส์เป็นโครงสร้างข้อมูลแบบมิติเดียวที่มีอยู่ในไลบรารี "แพนด้า"
-
ป้ายแกนเรียกรวมกันว่าดัชนี
-
โครงสร้างชุดข้อมูลสามารถจัดเก็บข้อมูลประเภทใดก็ได้ เช่น จำนวนเต็ม ทุ่น สตริง ออบเจ็กต์หลาม และอื่นๆ
เรามาดูตัวอย่างกัน −
ตัวอย่าง
import pandas as pd my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])} my_df = pd.DataFrame(my_data) print("The dataframe created from dictionary of series : ") print(my_df)
ผลลัพธ์
The dataframe created from dictionary f series : ab mn a 1.0 56 b 2.0 78 c 3.0 13 d NaN 13
คำอธิบาย
-
ไลบรารีที่จำเป็นจะถูกนำเข้า และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
-
ค่าพจนานุกรมที่ประกอบด้วยคีย์และค่าจะถูกสร้างขึ้น โดยที่ค่านั้นเป็นโครงสร้างข้อมูลแบบอนุกรม
-
พจนานุกรมของซีรีส์นี้จะถูกส่งต่อในภายหลังเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
-
ดาต้าเฟรมถูกสร้างขึ้นโดยส่งพจนานุกรมของซีรีส์เป็นพารามิเตอร์ไป
-
พิมพ์ดาต้าเฟรมบนคอนโซล
หมายเหตุ − คำว่า 'NaN' หมายถึง 'ไม่ใช่ตัวเลข' ซึ่งหมายความว่าค่า [row,col] เฉพาะไม่มีรายการที่ถูกต้อง