Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

จะเพิ่มคอลัมน์ใหม่ให้กับ dataframe ที่มีอยู่ใน Python ได้อย่างไร?


Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์

สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel สามารถสร้างได้โดยใช้ตัวสร้างต่อไปนี้ -

pd.Dataframe(data, index, columns, dtype, copy)

คุณสามารถเพิ่มคอลัมน์ใหม่ลงใน dataframe ได้หลายวิธี

ให้เราดูวิธีหนึ่งในการสร้างคอลัมน์ใหม่โดยสร้างโครงสร้างข้อมูลชุดแรกและส่งต่อไปเป็นคอลัมน์เพิ่มเติมไปยัง dataframe ที่มีอยู่

ให้เราดูรหัสในการใช้งานจริง -

ตัวอย่าง

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
print ("Adding a new column to the dataframe by passing it as a Series structure :")
my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])
print("After adding a new column to the dataframe, :")
print(my_df)

ผลลัพธ์

The dataframe is :
   ab   cd
a  1.0  1
b  8.0  2
c  7.0  0
d  NaN  9
Adding a new column to the dataframe by passing it as a Series structure :
After adding a new column to the dataframe, :
    ab  cd  ef
a  1.0  1   56.0
b  8.0  2  78.0
c  7.0  0  32.0
d  NaN  9  NaN

คำอธิบาย

  • ไลบรารีที่จำเป็นจะถูกนำเข้า และให้ชื่อแทนเพื่อความสะดวกในการใช้งาน

  • โครงสร้างข้อมูลพจนานุกรมถูกสร้างขึ้น โดยมีคู่คีย์-ค่าอยู่ในพจนานุกรมเดียว

  • ด้วยวิธีนี้ พจนานุกรมหลายเล่มจะถูกสร้างขึ้นและจัดเก็บไว้ในรายการ

  • 'ค่า' ในคู่ค่าคีย์จริง ๆ แล้วเป็นโครงสร้างข้อมูลแบบอนุกรม

  • ดัชนียังเป็นรายการค่าที่กำหนดเองอีกด้วย

  • พจนานุกรมนี้จะถูกส่งต่อไปเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'

  • ดาต้าเฟรมถูกสร้างขึ้นโดยส่งรายการค่าพจนานุกรมเป็นพารามิเตอร์ไป

  • มีการสร้างคอลัมน์ใหม่ขึ้นและกำหนดค่าเริ่มต้นในคอลัมน์นั้น

  • คอลัมน์ใหม่นี้ได้รับการจัดทำดัชนีไปยังดาต้าเฟรมเดิม

  • ด้วยวิธีนี้ คอลัมน์ใหม่จะถูกผูกไว้กับดาต้าเฟรม

  • พิมพ์ดาต้าเฟรมบนคอนโซล

หมายเหตุ − คำว่า 'NaN' หมายถึง 'ไม่ใช่ตัวเลข' ซึ่งหมายความว่าค่า [row,col] เฉพาะไม่มีรายการที่ถูกต้อง