Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์
สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ -
pd.Dataframe(data, index, columns, dtype, copy)
คุณสามารถเพิ่มคอลัมน์ใหม่ลงใน dataframe ได้หลายวิธี
ให้เราดูวิธีหนึ่งในการสร้างคอลัมน์ใหม่โดยสร้างโครงสร้างข้อมูลชุดแรกและส่งต่อไปเป็นคอลัมน์เพิ่มเติมไปยัง dataframe ที่มีอยู่
ให้เราดูรหัสในการใช้งานจริง -
ตัวอย่าง
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])} my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) print ("Adding a new column to the dataframe by passing it as a Series structure :") my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c']) print("After adding a new column to the dataframe, :") print(my_df)
ผลลัพธ์
The dataframe is : ab cd a 1.0 1 b 8.0 2 c 7.0 0 d NaN 9 Adding a new column to the dataframe by passing it as a Series structure : After adding a new column to the dataframe, : ab cd ef a 1.0 1 56.0 b 8.0 2 78.0 c 7.0 0 32.0 d NaN 9 NaN
คำอธิบาย
-
ไลบรารีที่จำเป็นจะถูกนำเข้า และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
-
โครงสร้างข้อมูลพจนานุกรมถูกสร้างขึ้น โดยมีคู่คีย์-ค่าอยู่ในพจนานุกรมเดียว
-
ด้วยวิธีนี้ พจนานุกรมหลายเล่มจะถูกสร้างขึ้นและจัดเก็บไว้ในรายการ
-
'ค่า' ในคู่ค่าคีย์จริง ๆ แล้วเป็นโครงสร้างข้อมูลแบบอนุกรม
-
ดัชนียังเป็นรายการค่าที่กำหนดเองอีกด้วย
-
พจนานุกรมนี้จะถูกส่งต่อไปเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
-
ดาต้าเฟรมถูกสร้างขึ้นโดยส่งรายการค่าพจนานุกรมเป็นพารามิเตอร์ไป
-
มีการสร้างคอลัมน์ใหม่ขึ้นและกำหนดค่าเริ่มต้นในคอลัมน์นั้น
-
คอลัมน์ใหม่นี้ได้รับการจัดทำดัชนีไปยังดาต้าเฟรมเดิม
-
ด้วยวิธีนี้ คอลัมน์ใหม่จะถูกผูกไว้กับดาต้าเฟรม
-
พิมพ์ดาต้าเฟรมบนคอนโซล
หมายเหตุ − คำว่า 'NaN' หมายถึง 'ไม่ใช่ตัวเลข' ซึ่งหมายความว่าค่า [row,col] เฉพาะไม่มีรายการที่ถูกต้อง