ในการกรองตามผลรวมของคอลัมน์ เราใช้ loc() กระบวนการ. ในตัวอย่างของเรา เรารวมคะแนนของนักเรียนแต่ละคนเพื่อให้ได้คอลัมน์นักเรียนที่มีคะแนนมากกว่า 400 นั่นคือ 80%
ขั้นแรก ให้สร้าง DataFrame พร้อมบันทึกของนักเรียน เรามีบันทึกของนักเรียน 3 คน นั่นคือ 3 คอลัมน์ -
dataFrame = pd.DataFrame({
'Jacob_Marks': [95, 90, 75, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 65, 45, 50]})
การกรองตามคอลัมน์ กำลังเรียกนักเรียนที่มีคะแนนรวมมากกว่า 400 -
dataFrame = dataFrame.loc[:, dataFrame.sum(axis=0) > 400]
ตัวอย่าง
ต่อไปนี้เป็นรหัสที่สมบูรณ์ -
import pandas as pd
# create a dataframe with 3 columns
dataFrame = pd.DataFrame({
'Jacob_Marks': [95, 90, 75, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 65, 45, 50]})
print"Dataframe...\n",dataFrame
# filtering on the basis of columns
# fetching student with total marks above 400
dataFrame = dataFrame.loc[:, dataFrame.sum(axis=0) > 400]
# dataframe
print"Updated Dataframe...\n",dataFrame ผลลัพธ์
สิ่งนี้จะสร้างผลลัพธ์ต่อไปนี้ -
Dataframe... Jacob_Marks Jamie_Marks Ted_Marks 0 95 77 60 1 90 76 50 2 75 65 65 3 85 45 85 4 88 50 70 Updated Dataframe... Jacob_Marks 0 95 1 90 2 75 3 85 4 88