Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

Python - จัดอันดับแถวของ Pandas DataFrame


การเพิ่มคอลัมน์ที่มีการจัดอันดับของแต่ละแถวใน data frame ที่ให้มา ซึ่งจะช่วยให้เราจัดเรียง data frame และกำหนดอันดับขององค์ประกอบเฉพาะ ตัวอย่างเช่น −

ดาต้าเฟรมของเรา

ชื่อเวลาเล่น (เป็นชั่วโมง) อัตรา
0 Call Of Duty 45 ดีกว่าค่าเฉลี่ย
1 ยาเกินขนาดทั้งหมด 46 ดี
2 GTA3 52 ดีที่สุด
3 บูลลี่ 22 เฉลี่ย

ผลลัพธ์

ชื่อเวลาเล่น (เป็นชั่วโมง) อันดับเรตติ้ง
0 Call Of Duty 45 ดีกว่าค่าเฉลี่ย 3.0
1 ยาเกินขนาดทั้งหมด 46 ดี 2.0
2 GTA3 52 ดีที่สุด 1.0
3 บูลลี่ 22 เฉลี่ย 4.0

ดังที่คุณเห็นในตัวอย่างข้างต้น การจัดอันดับของเราเป็นตัวเลขทั้งหมด แต่มีทศนิยมอยู่ข้างๆ นั่นหมายความว่าเราสามารถจัดลำดับด้วยจำนวนจริงได้เช่นกัน และนั่นจะเกิดขึ้นเมื่อมีองค์ประกอบมากกว่าหนึ่งองค์ประกอบมีอันดับเดียวกันใน กรอบข้อมูลมากกว่าในกรณีดังกล่าว การจัดอันดับของเราจะถูกแบ่งระหว่างองค์ประกอบต่างๆ ดังนั้นพวกเขาจึงมีอันดับเป็นจำนวนจริง

ตอนนี้เราจะกำหนดอันดับให้กับ data frame ของเราได้อย่างไร

สำหรับการกำหนดอันดับให้กับองค์ประกอบของ dataframe เราใช้ฟังก์ชันในตัวของไลบรารี pandas ที่ the .rank() การทำงาน. เราผ่านเกณฑ์โดยพิจารณาจากการจัดลำดับองค์ประกอบ และฟังก์ชันนี้จะคืนค่าคอลัมน์ใหม่ในแต่ละแถวที่จัดเก็บการจัดอันดับ

ตัวอย่าง

รหัสสำหรับการใช้ฟังก์ชัน .rank() คือ

import pandas as pd
games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'],
       'Play Time(in hours)' : ['45', '46', '52', '22'],
        'Rate' : ['Better than Average', 'Good', 'Best', 'Average']}
df = pd.DataFrame(games)
df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0)
print(df)# Hello World program in Python
   
print ("Hello World!");

ผลลัพธ์

    Name Play Time(in hours)       Rate ranking
0  Call Of Duty   45     Better than Average 3.0
1  TotalOverdose  46     Good                2.0
2  GTA 3          52     Best                1.0
3   Bully        22      Average             4.0

คำอธิบายของโค้ดด้านบน

ในโค้ดนี้ เราแค่ใช้ฟังก์ชันในตัวของไลบรารี่ของแพนด้าเพื่อจัดอันดับองค์ประกอบแต่ละรายการที่อยู่ในกรอบข้อมูลที่กำหนด เราสามารถใช้เกณฑ์ที่ดีที่สุดในการจัดอันดับองค์ประกอบด้วยคอลัมน์ 'เวลาเล่น(เป็นชั่วโมง)'

ตอนนี้เราเพิ่มคอลัมน์ชื่อ 'การจัดอันดับ' ในกรอบข้อมูลของเราและใช้ .rank() ทำงานในนั้นและส่งชื่อคอลัมน์ที่เราต้องทำการจัดอันดับองค์ประกอบของเรา (ในกรณีนี้คือคอลัมน์เวลาเล่น (เป็นชั่วโมง)) ตอนนี้เมื่อสร้างคอลัมน์ใหม่ของเรา เราจะพิมพ์กรอบข้อมูลของเรา

บทสรุป

ในบทช่วยสอนนี้ เราจัดอันดับแถวใน data frame ของเราแล้วพิมพ์ข้อมูลของเราโดยใช้ไลบรารี pandas และฟังก์ชันในตัว การจัดอันดับแถวของดาต้าเฟรมแพนด้าเป็นกระบวนการที่ง่าย แต่คุณต้องปฏิบัติตามวิธีการด้านบนอย่างถูกต้อง