การแสดงข้อมูลเป็นภาพเป็นขั้นตอนที่สำคัญ เนื่องจากช่วยให้เข้าใจสิ่งที่เกิดขึ้นในข้อมูลโดยไม่ต้องดูตัวเลขจริงๆ และทำการคำนวณที่ซับซ้อน Seaborn เป็นห้องสมุดที่ช่วยในการแสดงข้อมูล มันมาพร้อมกับธีมที่ปรับแต่งเองและอินเทอร์เฟซระดับสูง
แผนภูมิกระจายทั่วไป ฮิสโทแกรม ฯลฯ ไม่สามารถใช้เมื่อตัวแปรที่ต้องทำงานด้วยมีลักษณะการจัดหมวดหมู่ นี่คือเมื่อจำเป็นต้องใช้ scatterplot ที่จัดหมวดหมู่
พล็อตเช่น 'สตริปล็อต', 'สวอร์มพล็อต' ใช้เพื่อทำงานกับตัวแปรตามหมวดหมู่ ฟังก์ชัน 'สตริปล็อต' จะใช้เมื่ออย่างน้อยหนึ่งในตัวแปรถูกจัดหมวดหมู่ ข้อมูลจะแสดงในลักษณะที่จัดเรียงตามแกนใดแกนหนึ่ง แต่ข้อเสียคือมีบางจุดซ้อนทับกัน ซึ่งต้องใช้พารามิเตอร์ 'jitter' เพื่อหลีกเลี่ยงไม่ให้ตัวแปรทับซ้อนกัน
โดยจะเพิ่มสัญญาณรบกวนแบบสุ่มลงในชุดข้อมูล และปรับตำแหน่งของค่าตามแกนหมวดหมู่
ไวยากรณ์ของฟังก์ชันสตริปพล็อต
seaborn.stripplot(x, y,data, jitter = …)
ให้เราดูว่าพารามิเตอร์ 'jitter' สามารถใช้เพื่อพล็อตตัวแปรหมวดหมู่ในชุดข้อมูลได้อย่างไร -
ตัวอย่าง
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('iris') sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True) plt.show()
ผลลัพธ์
คำอธิบาย
- นำเข้าแพ็คเกจที่จำเป็น
- ข้อมูลที่ป้อนคือ 'iris_data' ซึ่งโหลดจากไลบรารี scikit เรียนรู้
- ข้อมูลนี้ถูกเก็บไว้ในดาต้าเฟรม
- ใช้ฟังก์ชัน "load_dataset" เพื่อโหลดข้อมูลไอริส
- ข้อมูลนี้แสดงเป็นภาพโดยใช้ฟังก์ชัน "สตริปล็อต"
- พารามิเตอร์เพิ่มเติมชื่อ 'กระวนกระวายใจ' จะถูกส่งต่อเพื่อหลีกเลี่ยงการทับซ้อนของค่าของ datafame
- ในที่นี้ ดาต้าเฟรมถูกจัดให้เป็นพารามิเตอร์
- นอกจากนี้ยังมีการระบุค่า x และ y
- ข้อมูลนี้แสดงบนคอนโซล