สมมติว่าคุณมี dataframe และผลลัพธ์สำหรับการลบแถวที่ซ้ำกันแรกคือ
Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14
วิธีแก้ปัญหา
เพื่อแก้ปัญหานี้ เราจะทำตามขั้นตอนด้านล่าง -
-
กำหนดดาต้าเฟรม
-
ใช้ฟังก์ชัน drop_duplicates ภายในคอลัมน์ Id และ Age จากนั้นกำหนดค่าให้คงค่าเริ่มต้นเป็น 'สุดท้าย'
df.drop_duplicates(subset=['Id','Age'],keep='last')
-
เก็บผลลัพธ์ไว้ใน dataframe เดียวกันแล้วพิมพ์
ตัวอย่าง
มาดูการใช้งานด้านล่างเพื่อความเข้าใจที่ดีขึ้น -
import pandas as pd df = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10], 'Age':[12,13,14,13,14,12,13,16,14,15,14] }) print("DataFrame is:\n",df) df = df.drop_duplicates(subset=['Id','Age'],keep='last') print("Dataframe after removing first duplicate rows:\n", df)
ผลลัพธ์
DataFrame is: Id Age 0 1 12 1 2 13 2 3 14 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14 Dataframe after removing first duplicate rows: Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14