Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

เขียนโปรแกรมใน Python เพื่อลบแถวที่ซ้ำกันแรกใน dataframe ที่กำหนด


สมมติว่าคุณมี dataframe และผลลัพธ์สำหรับการลบแถวที่ซ้ำกันแรกคือ

    Id Age
0    1 12
3    4 13
4    5 14
5    6 12
6    2 13
7    7 16
8    3 14
9    9 15
10  10 14

วิธีแก้ปัญหา

เพื่อแก้ปัญหานี้ เราจะทำตามขั้นตอนด้านล่าง -

  • กำหนดดาต้าเฟรม

  • ใช้ฟังก์ชัน drop_duplicates ภายในคอลัมน์ Id และ Age จากนั้นกำหนดค่าให้คงค่าเริ่มต้นเป็น 'สุดท้าย'

df.drop_duplicates(subset=['Id','Age'],keep='last')
  • เก็บผลลัพธ์ไว้ใน dataframe เดียวกันแล้วพิมพ์

ตัวอย่าง

มาดูการใช้งานด้านล่างเพื่อความเข้าใจที่ดีขึ้น -

import pandas as pd
df = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10],
                     'Age':[12,13,14,13,14,12,13,16,14,15,14]
                  })
print("DataFrame is:\n",df)
df = df.drop_duplicates(subset=['Id','Age'],keep='last')
print("Dataframe after removing first duplicate rows:\n", df)

ผลลัพธ์

DataFrame is:
    Id    Age
0    1    12
1    2    13
2    3    14
3    4    13
4    5    14
5    6    12
6    2    13
7    7    16
8    3    14
9    9    15
10  10    14
Dataframe after removing first duplicate rows:
    Id Age
0    1 12
3    4 13
4    5 14
5    6 12
6    2 13
7    7 16
8    3 14
9    9 15
10  10 14