Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

Python - กรองข้อมูลด้วย Pandas .query() method


Pandas เป็นไลบรารี่ไพทอนที่ใช้กันอย่างแพร่หลายสำหรับการล้างข้อมูล การวิเคราะห์ข้อมูล ฯลฯ ในบทความนี้ เราจะมาดูกันว่าเราจะใช้วิธีการสืบค้นข้อมูลเพื่อดึงข้อมูลเฉพาะจากชุดข้อมูลที่กำหนดได้อย่างไร เราสามารถมีทั้งเงื่อนไขเดียวและหลายเงื่อนไขภายในแบบสอบถาม

การอ่านข้อมูล

เรามาอ่านข้อมูลใน data frame ของแพนด้ากันก่อนโดยใช้ไลบรารี่ของ pandas โปรแกรมด้านล่างทำอย่างนั้น

ตัวอย่าง

import pandas as pd

# Reading data frame from csv file
data = pd.read_csv("D:\\heart.csv")

print(data)

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

Python - กรองข้อมูลด้วย Pandas .query() method

แบบสอบถามที่มีเงื่อนไขเดียว

ต่อไปเราจะมาดูกันว่าเราจะใช้วิธีการสืบค้นแบบมีเงื่อนไขเดียวได้อย่างไร ดังที่คุณเห็นผลลัพธ์ที่ได้คือ 119 แถวจากเดิม 303 แถวเท่านั้น

ตัวอย่าง

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\\heart.csv")

data.query('chol < 230', inplace=True)

# Result
print(data)

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

Python - กรองข้อมูลด้วย Pandas .query() method

แบบสอบถามที่มีหลายเงื่อนไข

ในแนวทางที่คล้ายคลึงกันข้างต้น เราสามารถใช้หลายเงื่อนไขกับวิธีการสืบค้นได้ ซึ่งจะจำกัดชุดข้อมูลผลลัพธ์เพิ่มเติม ขณะนี้ระบบจะส่งคืนเพียง 79 แถวเมื่อเราจำกัดอายุไว้ที่มากกว่า 60 ปี

ตัวอย่าง

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\\heart.csv")

data.query('chol < 230' and 'age > 60', inplace=True)

# Result
print(data)

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

Python - กรองข้อมูลด้วย Pandas .query() method