การเพิ่มคอลัมน์ที่มีการจัดอันดับของแต่ละแถวใน data frame ที่ให้มา ซึ่งจะช่วยให้เราจัดเรียง data frame และกำหนดอันดับขององค์ประกอบเฉพาะ ตัวอย่างเช่น −
ดาต้าเฟรมของเรา
ชื่อเวลาเล่น (เป็นชั่วโมง) | อัตรา | |||
---|---|---|---|---|
0 | Call Of Duty | 45 | ดีกว่าค่าเฉลี่ย | |
1 | ยาเกินขนาดทั้งหมด | 46 | ดี | |
2 | GTA3 | 52 | ดีที่สุด | |
3 | บูลลี่ | 22 | เฉลี่ย |
ผลลัพธ์
ชื่อเวลาเล่น (เป็นชั่วโมง) | อันดับเรตติ้ง | |||
---|---|---|---|---|
0 | Call Of Duty | 45 | ดีกว่าค่าเฉลี่ย | 3.0 |
1 | ยาเกินขนาดทั้งหมด | 46 | ดี | 2.0 |
2 | GTA3 | 52 | ดีที่สุด | 1.0 |
3 | บูลลี่ | 22 | เฉลี่ย | 4.0 |
ดังที่คุณเห็นในตัวอย่างข้างต้น การจัดอันดับของเราเป็นตัวเลขทั้งหมด แต่มีทศนิยมอยู่ข้างๆ นั่นหมายความว่าเราสามารถจัดลำดับด้วยจำนวนจริงได้เช่นกัน และนั่นจะเกิดขึ้นเมื่อมีองค์ประกอบมากกว่าหนึ่งองค์ประกอบมีอันดับเดียวกันใน กรอบข้อมูลมากกว่าในกรณีดังกล่าว การจัดอันดับของเราจะถูกแบ่งระหว่างองค์ประกอบต่างๆ ดังนั้นพวกเขาจึงมีอันดับเป็นจำนวนจริง
ตอนนี้เราจะกำหนดอันดับให้กับ data frame ของเราได้อย่างไร
สำหรับการกำหนดอันดับให้กับองค์ประกอบของ dataframe เราใช้ฟังก์ชันในตัวของไลบรารี pandas ที่ the .rank() การทำงาน. เราผ่านเกณฑ์โดยพิจารณาจากการจัดลำดับองค์ประกอบ และฟังก์ชันนี้จะคืนค่าคอลัมน์ใหม่ในแต่ละแถวที่จัดเก็บการจัดอันดับ
ตัวอย่าง
รหัสสำหรับการใช้ฟังก์ชัน .rank() คือ
import pandas as pd games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'], 'Play Time(in hours)' : ['45', '46', '52', '22'], 'Rate' : ['Better than Average', 'Good', 'Best', 'Average']} df = pd.DataFrame(games) df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0) print(df)# Hello World program in Python print ("Hello World!");
ผลลัพธ์
Name Play Time(in hours) Rate ranking 0 Call Of Duty 45 Better than Average 3.0 1 TotalOverdose 46 Good 2.0 2 GTA 3 52 Best 1.0 3 Bully 22 Average 4.0
คำอธิบายของโค้ดด้านบน
ในโค้ดนี้ เราแค่ใช้ฟังก์ชันในตัวของไลบรารี่ของแพนด้าเพื่อจัดอันดับองค์ประกอบแต่ละรายการที่อยู่ในกรอบข้อมูลที่กำหนด เราสามารถใช้เกณฑ์ที่ดีที่สุดในการจัดอันดับองค์ประกอบด้วยคอลัมน์ 'เวลาเล่น(เป็นชั่วโมง)'
ตอนนี้เราเพิ่มคอลัมน์ชื่อ 'การจัดอันดับ' ในกรอบข้อมูลของเราและใช้ .rank() ทำงานในนั้นและส่งชื่อคอลัมน์ที่เราต้องทำการจัดอันดับองค์ประกอบของเรา (ในกรณีนี้คือคอลัมน์เวลาเล่น (เป็นชั่วโมง)) ตอนนี้เมื่อสร้างคอลัมน์ใหม่ของเรา เราจะพิมพ์กรอบข้อมูลของเรา
บทสรุป
ในบทช่วยสอนนี้ เราจัดอันดับแถวใน data frame ของเราแล้วพิมพ์ข้อมูลของเราโดยใช้ไลบรารี pandas และฟังก์ชันในตัว การจัดอันดับแถวของดาต้าเฟรมแพนด้าเป็นกระบวนการที่ง่าย แต่คุณต้องปฏิบัติตามวิธีการด้านบนอย่างถูกต้อง