Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

Python Pandas CategoricalIndex - เพิ่มหมวดหมู่ใหม่


หากต้องการเพิ่มหมวดหมู่ใหม่ ให้ใช้ CategoricalIndex add_categories() วิธีการในแพนด้า ขั้นแรก นำเข้าไลบรารีที่จำเป็น -

import pandas as pd

ตั้งค่าหมวดหมู่สำหรับหมวดหมู่โดยใช้พารามิเตอร์ "หมวดหมู่" ปฏิบัติต่อการจัดหมวดหมู่ตามคำสั่งโดยใช้พารามิเตอร์ "จัดลำดับ" -

catIndex = pd.CategoricalIndex(["p", "q", "r", "s","p", "q", "r", "s"], ordered=True, categories=["p", "q", "r", "s"])

แสดงดัชนีหมวดหมู่ -

print("CategoricalIndex...\n",catIndex)

เพิ่มหมวดหมู่ใหม่โดยใช้ add_categories() ตั้งค่าหมวดหมู่ใหม่เป็นพารามิเตอร์ หมวดหมู่ใหม่จะรวมอยู่ในตำแหน่งสุดท้าย/สูงสุดในหมวดหมู่ -

print("\nCategoricalIndex after adding new categories...\n",catIndex.add_categories(["a", "b", "c", "d"]))

ตัวอย่าง

ต่อไปนี้เป็นรหัส -

import pandas as pd

# CategoricalIndex can only take on a limited, and usually fixed, number of possible values (categories
# Set the categories for the categorical using the "categories" parameter
# Treat the categorical as ordered using the "ordered" parameter
catIndex = pd.CategoricalIndex(["p", "q", "r", "s","p", "q", "r", "s"], ordered=True, categories=["p", "q", "r", "s"])

# Display the CategoricalIndex
print("CategoricalIndex...\n",catIndex)

# Get the categories
print("\nDisplayingCategories from CategoricalIndex...\n",catIndex.categories)

# Add new categories using add_categories()
# Set the new categories as a parameter
# The new categories will be included at the last/highest place in the categories
print("\nCategoricalIndex after adding new categories...\n",catIndex.add_categories(["a", "b", "c", "d"]))

ผลลัพธ์

สิ่งนี้จะสร้างผลลัพธ์ต่อไปนี้ -

CategoricalIndex...
CategoricalIndex(['p', 'q', 'r', 's', 'p', 'q', 'r', 's'], categories=['p', 'q', 'r', 's'], ordered=True, dtype='category')

DisplayingCategories from CategoricalIndex...
Index(['p', 'q', 'r', 's'], dtype='object')

CategoricalIndex after adding new categories...
CategoricalIndex(['p', 'q', 'r', 's', 'p', 'q', 'r', 's'], categories=['p', 'q', 'r', 's', 'a', 'b', 'c', 'd'], ordered=True, dtype='category')