Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

จะหลีกเลี่ยงจุดที่ทับซ้อนกันในขณะที่ใช้ stripplot ในพล็อตกระจายหมวดหมู่ Seaborn Library ใน Python ได้อย่างไร


การแสดงข้อมูลเป็นภาพเป็นขั้นตอนที่สำคัญ เนื่องจากช่วยให้เข้าใจสิ่งที่เกิดขึ้นในข้อมูลโดยไม่ต้องดูตัวเลขจริงๆ และทำการคำนวณที่ซับซ้อน Seaborn เป็นห้องสมุดที่ช่วยในการแสดงข้อมูล มันมาพร้อมกับธีมที่ปรับแต่งเองและอินเทอร์เฟซระดับสูง

แผนภูมิกระจายทั่วไป ฮิสโทแกรม ฯลฯ ไม่สามารถใช้เมื่อตัวแปรที่ต้องทำงานด้วยมีลักษณะการจัดหมวดหมู่ นี่คือเมื่อจำเป็นต้องใช้ scatterplot ที่จัดหมวดหมู่

พล็อตเช่น 'สตริปล็อต', 'สวอร์มพล็อต' ใช้เพื่อทำงานกับตัวแปรตามหมวดหมู่ ฟังก์ชัน 'สตริปล็อต' จะใช้เมื่ออย่างน้อยหนึ่งในตัวแปรถูกจัดหมวดหมู่ ข้อมูลจะแสดงในลักษณะที่จัดเรียงตามแกนใดแกนหนึ่ง แต่ข้อเสียคือมีบางจุดซ้อนทับกัน ซึ่งต้องใช้พารามิเตอร์ 'jitter' เพื่อหลีกเลี่ยงไม่ให้ตัวแปรทับซ้อนกัน

โดยจะเพิ่มสัญญาณรบกวนแบบสุ่มลงในชุดข้อมูล และปรับตำแหน่งของค่าตามแกนหมวดหมู่

ไวยากรณ์ของฟังก์ชันสตริปพล็อต

seaborn.stripplot(x, y,data, jitter = …)

ให้เราดูว่าพารามิเตอร์ 'jitter' สามารถใช้เพื่อพล็อตตัวแปรหมวดหมู่ในชุดข้อมูลได้อย่างไร -

ตัวอย่าง

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True)
plt.show()

ผลลัพธ์

จะหลีกเลี่ยงจุดที่ทับซ้อนกันในขณะที่ใช้ stripplot ในพล็อตกระจายหมวดหมู่ Seaborn Library ใน Python ได้อย่างไร

คำอธิบาย

  • นำเข้าแพ็คเกจที่จำเป็น
  • ข้อมูลที่ป้อนคือ 'iris_data' ซึ่งโหลดจากไลบรารี scikit เรียนรู้
  • ข้อมูลนี้ถูกเก็บไว้ในดาต้าเฟรม
  • ใช้ฟังก์ชัน "load_dataset" เพื่อโหลดข้อมูลไอริส
  • ข้อมูลนี้แสดงเป็นภาพโดยใช้ฟังก์ชัน "สตริปล็อต"
  • พารามิเตอร์เพิ่มเติมชื่อ 'กระวนกระวายใจ' จะถูกส่งต่อเพื่อหลีกเลี่ยงการทับซ้อนของค่าของ datafame
  • ในที่นี้ ดาต้าเฟรมถูกจัดให้เป็นพารามิเตอร์
  • นอกจากนี้ยังมีการระบุค่า x และ y
  • ข้อมูลนี้แสดงบนคอนโซล