Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

จะรวมไฟล์ CSV ทั้งหมดไว้ใน dataframe เดียวได้อย่างไร - Python Pandas


หากต้องการรวมไฟล์ CSV ทั้งหมด ให้ใช้โมดูล GLOB ใช้เมธอด os.path.join() ใน concat() เพื่อรวมไฟล์ CSV เข้าด้วยกัน

ขั้นแรก นำเข้าไลบรารีที่จำเป็น เราได้ตั้ง pd เป็นนามแฝงสำหรับไลบรารีแพนด้า -

import pandas as pd
import glob
import os

ตอนนี้ สมมติว่าเรามีไฟล์ CSV 3 ไฟล์ต่อไปนี้ -

Sales1.csv

จะรวมไฟล์ CSV ทั้งหมดไว้ใน dataframe เดียวได้อย่างไร - Python Pandas

Sales2.csv

จะรวมไฟล์ CSV ทั้งหมดไว้ใน dataframe เดียวได้อย่างไร - Python Pandas

Sales3.csv

จะรวมไฟล์ CSV ทั้งหมดไว้ใน dataframe เดียวได้อย่างไร - Python Pandas

ขั้นแรก กำหนดเส้นทางสำหรับการเข้าร่วมหลายไฟล์ เรามีไฟล์ CSV ทั้งหมดที่จะรวมบนเดสก์ท็อป -

files = os.path.join("C:\\Users\\amit_\\Desktop\\", "sales*.csv")

ถัดไป ใช้ glob เพื่อส่งคืนรายการไฟล์ที่ผสาน -

files = glob.glob(files)

ตัวอย่าง

ต่อไปนี้เป็นรหัส -

import pandas as pd
import glob
import os

# setting the path for joining multiple files
files = os.path.join("C:\\Users\\amit_\\Desktop\\", "sales*.csv")

# list of merged files returned
files = glob.glob(files)

print("Resultant CSV after joining all CSV files at a particular location...");

# joining files with concat and read_csv
df = pd.concat(map(pd.read_csv, files), ignore_index=True)
print(df)

ผลลัพธ์

สิ่งนี้จะทำให้เกิดสิ่งต่อไปนี้ -

Resultant CSV after joining all CSV files at a particular location...
           Car      Place   UnitsSold
0         Audi  Bangalore          80
1      Porsche     Mumbai         110
2   RollsRoyce       Pune         100
3          BMW      Delhi          95
4     Mercedes  Hyderabad          80
5  Lamborghini Chandigarh          80
6        Volvo  Rajasthan         150
7      Hyundai    Manipur         120
8       Toyota         HP          70