Dataframe คือโครงสร้างข้อมูลสองมิติ โดยที่ข้อมูลจะถูกจัดเก็บในรูปแบบตาราง ในรูปแบบของแถวและคอลัมน์
สามารถมองเห็นเป็นตารางข้อมูล SQL หรือการแสดงแผ่นงาน Excel คอลัมน์ใน dataframe สามารถลบได้โดยใช้วิธีการต่างๆ
เราจะเห็นตัวดำเนินการ 'del' ที่ใช้ชื่อของคอลัมน์ที่ต้องการลบเป็นพารามิเตอร์แล้วลบออก -
ตัวอย่าง
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']), 'ef' : pd.Series([56, 78, 32],index=['a','b','c']), 'gh' : pd.Series([66, 77, 88, 99],index=['a','b','c', 'd']) } my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) print("Deleting the column using the 'del' operator") del my_df['cd'] print(my_df)
ผลลัพธ์
The dataframe is : ab cd ef gh a 1.0 1 56.0 66 b 8.0 2 78.0 77 c 7.0 0 32.0 88 d NaN 9 NaN 99 Deleting the column using the 'del' operator ab ef gh a 1.0 56.0 66 b 8.0 78.0 77 c 7.0 32.0 88 d NaN NaN 99
คำอธิบาย
-
ไลบรารีที่จำเป็นจะถูกนำเข้าและให้ชื่อแทนเพื่อความสะดวกในการใช้งาน
-
ค่าพจนานุกรมที่ประกอบด้วยคีย์และค่าจะถูกสร้างขึ้น โดยที่ค่านั้นเป็นโครงสร้างข้อมูลแบบอนุกรม
-
พจนานุกรมนี้จะถูกส่งต่อไปเป็นพารามิเตอร์ไปยังฟังก์ชัน 'Dataframe' ที่มีอยู่ในไลบรารี 'pandas'
-
คำหลัก 'del' ใช้เพื่อลบคอลัมน์เฉพาะ
-
ชื่อของคอลัมน์ที่ต้องลบจะถูกส่งต่อเป็นพารามิเตอร์ไปยังตัวดำเนินการ 'del'
-
พิมพ์ dataframe ใหม่บนคอนโซล
หมายเหตุ − คำว่า 'NaN' หมายถึง 'ไม่ใช่ตัวเลข' ซึ่งหมายความว่าค่า [row,col] เฉพาะไม่มีรายการที่ถูกต้อง