หน้าแรก
หน้าแรก
หากต้องการค้นหาสรุปสถิติของ DataFrame ให้ใช้วิธีอธิบาย () ตอนแรกเราได้นำเข้าไลบรารีแพนด้าต่อไปนี้ด้วยนามแฝง import pandas as pd ต่อไปนี้เป็นไฟล์ CSV ของเรา และเรากำลังสร้าง Pandas DataFrame - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") ตอนนี้ รับข้อมูลสรุปสถิติขอ
หากต้องการลบค่าที่หายไปเช่นค่า NaN ให้ใช้ dropna() กระบวนการ. ขั้นแรก ให้เรานำเข้าไลบรารีที่จำเป็น - import pandas as pd อ่าน CSV และสร้าง DataFrame - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") ใช้ dropna() เพื่อลบค่าที่หายไป NaN จะถูกแสดงสำหรับค่าที่หายไปหลังจ
ในการเปลี่ยนชื่อคอลัมน์ของ DataFrame ให้ใช้ rename() กระบวนการ. ตั้งชื่อคอลัมน์ที่คุณต้องการเปลี่ยนชื่อภายใต้พารามิเตอร์ columns ของวิธีการเปลี่ยนชื่อ () ตัวอย่างเช่น การเปลี่ยน “รถยนต์ ” ถึง “ชื่อรถ ” − dataFrame.rename(columns={'Car': 'Car Name'}, inplace=False) ขั้นแรก อ่าน CSV แ
ในการสร้างคอลัมน์ใหม่ เราจะใช้คอลัมน์ที่สร้างไว้แล้ว ขั้นแรก ให้เราสร้าง DataFrame และอ่าน CSV ของเรา – dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesRecords.csv") ตอนนี้ เราจะสร้างคอลัมน์ใหม่ New_Reg_Price จากคอลัมน์ Reg_Price ที่สร้างไว้แล้ว และเพิ่ม 100 ให้กับแต่ละค่า สร้างค
เราสามารถกำหนดเงื่อนไขและดึงข้อมูลแถว DataFrame เงื่อนไขเหล่านี้สามารถตั้งค่าได้โดยใช้ตัวดำเนินการเชิงตรรกะและแม้แต่ตัวดำเนินการเชิงสัมพันธ์ ขั้นแรก นำเข้าไลบรารีแพนด้าที่จำเป็น - import pandas as pd ให้เราสร้าง DataFrame และอ่านไฟล์ CSV ของเรา - dataFrame = pd.read_csv("C:\\Users\\amit_\\Des
Bar Plot ใน Seaborn ใช้เพื่อแสดงค่าประมาณจุดและช่วงความเชื่อมั่นเป็นแท่งสี่เหลี่ยม ใช้ seaborn.barplot() จัดรูปแบบแถบโดยใช้ สีหน้า , ความกว้างของเส้น และ edgecolor พารามิเตอร์ สมมติว่าต่อไปนี้คือชุดข้อมูลของเราในรูปแบบไฟล์ CSV −Cricketers2.csv ขั้นแรก นำเข้าไลบรารีที่จำเป็น - import seaborn as sb
Lineplot ใน Seaborn ใช้เพื่อวาดเส้นโครงที่มีความเป็นไปได้ของการจัดกลุ่มความหมายหลายกลุ่ม seaborn.lineplot() ใช้สำหรับสิ่งนี้ ในการลงจุด lineplot ด้วยชุดข้อมูลทั้งหมด เพียงใช้ lineplot() และตั้งค่าชุดข้อมูลให้สมบูรณ์โดยไม่ต้องพูดถึงค่า x และ y สมมติว่าต่อไปนี้คือชุดข้อมูลของเราในรูปแบบไฟล์ CSV - Cri
สำหรับแผนภูมิแท่งแนวนอนที่จัดกลุ่มไว้ซึ่งมีคอลัมน์ทั้งหมด ให้สร้างแผนภูมิแท่งโดยใช้ barh() และไม่ต้องตั้งค่า a และ y ขั้นแรก นำเข้าไลบรารีที่จำเป็น - import pandas as pd import matplotlib.pyplot as plt สร้าง DataFrame ที่มี 3 คอลัมน์ - dataFrame = pd.DataFrame({"Car": ['Bentley',
ใช้ “วิธีการ ” พารามิเตอร์ของ fillna () กระบวนการ. สำหรับการกรอกย้อนหลัง ให้ใช้ค่า ‘bfill’ ดังแสดงด้านล่าง − fillna(method='bfill') สมมติว่าต่อไปนี้คือไฟล์ CSV ของเราที่เปิดใน Microsoft Excel โดยมีค่า NaN บางส่วน - ขั้นแรก นำเข้าไลบรารีที่จำเป็น - import pandas as pd โหลดข้อมูลจากไฟล์ C
ใช้วิธีการ interpolate() เพื่อเติมค่า NaN สมมติว่าต่อไปนี้คือไฟล์ CSV ของเราที่เปิดใน Microsoft Excel โดยมีค่า NaN บางส่วน - โหลดข้อมูลจากไฟล์ CSV ลงใน Pandas DataFrame - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") เติมค่า NaN ด้วย interpolate() - dataFrame.inte
หากต้องการพล็อต swarmplot ที่ด้านบนของกล่องพล็อต อันดับแรก ให้ตั้งค่า boxplot() จากนั้นจึงตั้งค่า swarmplot() ด้วยค่า x และ y เดียวกัน Box Plot ใน Seaborn ใช้เพื่อวาดโครงกล่องเพื่อแสดงการแจกแจงตามหมวดหมู่ seaborn.boxplot() ใช้สำหรับสิ่งนี้ Swarm Plot ใน Seaborn ใช้ในการวาด scatterplot ที่มีจุดไม่ทั
หากต้องการข้ามพื้นที่เริ่มต้นจาก Pandas DataFrame ให้ใช้ skipinitialspace พารามิเตอร์ของ read_csv () กระบวนการ. ตั้งค่าพารามิเตอร์เป็น จริง เพื่อลบพื้นที่ส่วนเกิน สมมติว่าต่อไปนี้คือไฟล์ csv ของเรา – เราควรได้ผลลัพธ์ต่อไปนี้ เช่น ข้ามช่องว่างเริ่มต้นและแสดง DataFrame จาก CSV - ตัวอย่าง ต่อไปน
หากต้องการวางแถวว่างใน Pandas DataFrame ให้ใช้เมธอด dropna() สมมติว่าต่อไปนี้คือไฟล์ CSV ของเราที่มีค่า NaN เช่น null - ให้เราอ่านไฟล์ CSV โดยใช้ read_csv() CSV ของเราอยู่บนเดสก์ท็อป - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") ลบค่า null โดยใช้ dropna() - dat
เมธอด notnull() ส่งคืนค่าบูลีน เช่น หาก DataFrame มีค่าว่าง ระบบจะคืนค่าเป็นเท็จ มิฉะนั้นจะเป็น True สมมติว่าต่อไปนี้คือไฟล์ CSV ของเราที่มีค่า NaN เช่น null - ให้เราอ่านไฟล์ CSV ก่อน - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") กำลังตรวจสอบค่าที่ไม่เป็นโมฆะ
ในการสร้าง Multiindex จาก DataFrame ให้ใช้ MultiIndex from_frame() วิธีการ ขั้นแรก ให้เราสร้างพจนานุกรมรายการ - d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],'Date_of_purchase': ['2020-10-10', '2020-1
ในการรวม Pandas DataFrame สองตัวเข้ากับคอลัมน์ทั่วไป ให้ใช้ merge() ฟังก์ชันและตั้งค่า เปิด พารามิเตอร์เป็นชื่อคอลัมน์ หากต้องการตั้งค่า NaN สำหรับค่าที่ไม่ตรงกัน ให้ใช้ “วิธี ” และตั้งค่าเป็น ซ้าย หรือใช่ . นั่นก็หมายความว่าจะรวมกันทางซ้ายหรือขวา ขั้นแรก ให้เรานำเข้าไลบรารีแพนด้าด้วยนามแฝง - impor
ในการผสาน Pandas DataFrame ให้ใช้ merge() การทำงาน. ผลิตภัณฑ์คาร์ทีเซียนถูกนำไปใช้กับทั้ง DataFrames โดยการตั้งค่าภายใต้ “วิธี ” พารามิเตอร์ของฟังก์ชัน merge() เช่น − how = “cross” ขั้นแรก ให้เรานำเข้าไลบรารีแพนด้าด้วยนามแฝง - import pandas as pd สร้าง DataFrame1 - dataFrame1 = pd.Dat
ในการผสาน Pandas DataFrame ให้ใช้ merge() การทำงาน. ความสัมพันธ์แบบหนึ่งต่อกลุ่ม ถูกนำไปใช้กับทั้ง DataFrames โดยการตั้งค่าภายใต้ “ตรวจสอบ ” พารามิเตอร์ของฟังก์ชัน merge() เช่น − validate = “one-to-many” or validate = “1:m” ความสัมพันธ์แบบหนึ่งต่อกลุ่มจะตรวจสอบว่าคีย์ผสานไม่
หากต้องการแยกชื่อค่าและจำนวน ให้เราสร้าง DataFrame ที่มี 4 คอลัมน์ก่อน - dataFrame = pd.DataFrame({"Car": ['BMW', 'Mustang', 'Tesla', 'Mustang', 'Mercedes', 'Tesla', 'Audi'],"Cubic Capacity": [2000, 1800, 1500, 2500, 2200, 3
ในการคำนวณค่ากลุ่มก่อน ให้ใช้เมธอด groupby.first() ขั้นแรก นำเข้าไลบรารีที่จำเป็นด้วยนามแฝง - import pandas as pd; สร้าง DataFrame ที่มี 3 คอลัมน์ - dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'L