เมื่อมีการสร้างแบบจำลองการถดถอย เนื่องจากเราจำเป็นต้องเข้าใจถึงความสัมพันธ์ที่มีอยู่ระหว่างชุดค่าผสมต่างๆ ของตัวแปรต่อเนื่องทั้งหมด หากมีหลายตัวแปรระหว่างตัวแปร เราต้องตรวจสอบให้แน่ใจว่าได้ลบออกจากข้อมูลแล้ว
นี่คือที่มาของฟังก์ชัน 'regpot' และ 'implot' ช่วยให้เห็นภาพความสัมพันธ์เชิงเส้นระหว่างตัวแปรในการถดถอยเชิงเส้น
ฟังก์ชัน 'regplot' ยอมรับค่าของตัวแปร 'x' และ 'y' ในรูปแบบต่างๆ ซึ่งรวมถึงอาร์เรย์ numpy, ออบเจ็กต์ชุดแพนด้า, การอ้างอิงถึงตัวแปรหรือค่าจากดาต้าเฟรมของแพนด้า
ในทางกลับกัน ฟังก์ชัน 'implot' กำหนดให้ผู้ใช้ส่งพารามิเตอร์เฉพาะสำหรับข้อมูล และค่าสำหรับตัวแปร 'x' และ 'y' ต้องเป็นสตริง รูปแบบข้อมูลประเภทนี้เรียกว่าข้อมูลรูปแบบยาว นี่คือตัวอย่าง −
ตัวอย่าง
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('tips') sb.lmplot(x = "size", y = "tip", data = my_df) plt.show()
ผลลัพธ์
คำอธิบาย
- นำเข้าแพ็คเกจที่จำเป็น
- ข้อมูลที่ป้อนคือ 'เคล็ดลับ' ซึ่งโหลดจากห้องสมุด Seaborn
- ข้อมูลนี้ถูกเก็บไว้ในดาต้าเฟรม
- ใช้ฟังก์ชัน "load_dataset" เพื่อโหลดข้อมูลไอริส
- ข้อมูลนี้แสดงเป็นภาพโดยใช้ฟังก์ชัน "implot"
- ในที่นี้ ดาต้าเฟรมถูกจัดให้เป็นพารามิเตอร์
- นอกจากนี้ยังมีการระบุค่า x และ y
- ข้อมูลนี้แสดงบนคอนโซล