หากเราต้องการเปรียบเทียบข้อมูลที่อยู่ในหมวดหมู่ แผนผังกล่องก็จะเข้ามามีบทบาท เป็นวิธีที่เข้าใจการกระจายข้อมูลในชุดข้อมูลโดยใช้ควอร์ไทล์ ประกอบด้วยเส้นแนวตั้งที่ยื่นออกมาจากกล่อง นามสกุลเหล่านี้เรียกว่าหนวด หนวดเหล่านี้บอกว่าข้อมูลมีความแตกต่างกันอย่างไรนอกควอไทล์บนและควอไทล์ล่าง นี่คือเหตุผลที่แปลงกล่องเรียกอีกอย่างว่าแปลงหนวด ค่าผิดปกติในข้อมูลจะถูกวาดเป็นจุดแต่ละจุด
พล็อตไวโอลินเป็นการผสมผสานระหว่างพล็อตกล่องที่มีการประมาณความหนาแน่นของเคอร์เนล (KDE) ง่ายต่อการวิเคราะห์และทำความเข้าใจว่าข้อมูลมีการกระจายอย่างไร ส่วนกว้างของไวโอลินบ่งบอกถึงความหนาแน่นของข้อมูลที่สูงขึ้น ส่วนที่แคบของไวโอลินแสดงถึงความหนาแน่นของข้อมูลต่ำ
ช่วงระหว่างควอร์ไทล์ภายใน boxplot และส่วนความหนาแน่นที่สูงขึ้นของข้อมูลอยู่ในขอบเขตเดียวกันในทุกหมวดหมู่
ไวยากรณ์ของฟังก์ชันไวโอลิน
seaborn.violinplot(x, y,data,…)
ให้เราทำความเข้าใจว่าโครงไวโอลินสามารถนำมาใช้เพื่อพล็อตข้อมูลได้อย่างไร -
ตัวอย่าง
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('tips') sb.violinplot(x = "day", y = "total_bill", data=my_df) plt.show()
ผลลัพธ์
คำอธิบาย
- นำเข้าแพ็คเกจที่จำเป็น
- ข้อมูลที่ป้อนคือ 'iris_data' ซึ่งโหลดจากไลบรารี scikit เรียนรู้
- ข้อมูลนี้ถูกเก็บไว้ในดาต้าเฟรม
- ใช้ฟังก์ชัน "load_dataset" เพื่อโหลดข้อมูลไอริส
- ข้อมูลนี้แสดงเป็นภาพโดยใช้ฟังก์ชัน "ไวโอลินพล็อต"
- ในที่นี้ ดาต้าเฟรมถูกจัดให้เป็นพารามิเตอร์
- นอกจากนี้ยังมีการระบุค่า x และ y
- ข้อมูลนี้แสดงบนคอนโซล