Pandas เป็นไลบรารี่ไพทอนที่ใช้กันอย่างแพร่หลายสำหรับการล้างข้อมูล การวิเคราะห์ข้อมูล ฯลฯ ในบทความนี้ เราจะมาดูกันว่าเราจะใช้วิธีการสืบค้นข้อมูลเพื่อดึงข้อมูลเฉพาะจากชุดข้อมูลที่กำหนดได้อย่างไร เราสามารถมีทั้งเงื่อนไขเดียวและหลายเงื่อนไขภายในแบบสอบถาม
การอ่านข้อมูล
เรามาอ่านข้อมูลใน data frame ของแพนด้ากันก่อนโดยใช้ไลบรารี่ของ pandas โปรแกรมด้านล่างทำอย่างนั้น
ตัวอย่าง
import pandas as pd # Reading data frame from csv file data = pd.read_csv("D:\\heart.csv") print(data)
ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
แบบสอบถามที่มีเงื่อนไขเดียว
ต่อไปเราจะมาดูกันว่าเราจะใช้วิธีการสืบค้นแบบมีเงื่อนไขเดียวได้อย่างไร ดังที่คุณเห็นผลลัพธ์ที่ได้คือ 119 แถวจากเดิม 303 แถวเท่านั้น
ตัวอย่าง
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\\heart.csv") data.query('chol < 230', inplace=True) # Result print(data)
ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
แบบสอบถามที่มีหลายเงื่อนไข
ในแนวทางที่คล้ายคลึงกันข้างต้น เราสามารถใช้หลายเงื่อนไขกับวิธีการสืบค้นได้ ซึ่งจะจำกัดชุดข้อมูลผลลัพธ์เพิ่มเติม ขณะนี้ระบบจะส่งคืนเพียง 79 แถวเมื่อเราจำกัดอายุไว้ที่มากกว่า 60 ปี
ตัวอย่าง
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\\heart.csv") data.query('chol < 230' and 'age > 60', inplace=True) # Result print(data)
ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -