ในการดึงแถวทั่วไประหว่างสอง DataFrames ให้ใช้ concat() การทำงาน. ให้เราสร้าง DataFrame1 ด้วยสองคอลัมน์ -
dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'], "Reg_Price": [1000, 1500, 1100, 800, 1100, 900] } )
สร้าง DataFrame2 ด้วยสองคอลัมน์ -
dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'], "Reg_Price": [1200, 1500, 1000, 800, 1100, 1000] } )
ค้นหาแถวทั่วไประหว่างสอง DataFrames ด้วย concat() -
dfRes = pd.concat([dataFrame1, dataFrame2])
รีเซ็ตดัชนี -
dfRes = dfRes.reset_index(drop=True)
จัดกลุ่มตามคอลัมน์ -
dfGroup = dfRes.groupby(list(dfRes.columns))
รับความยาวของแต่ละแถวเพื่อคำนวณการนับ หากจำนวนมากกว่า 1 แสดงว่าแถวทั่วไป -
res = [k[0] for k in dfGroup.groups.values() if len(k) > 1]
ตัวอย่าง
ต่อไปนี้เป็นรหัส -
import pandas as pd # Create DataFrame1 dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'], "Reg_Price": [1000, 1500, 1100, 800, 1100, 900] } ) print"DataFrame1 ...\n",dataFrame1 # Create DataFrame2 dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'], "Reg_Price": [1200, 1500, 1000, 800, 1100, 1000] } ) print"\nDataFrame2 ...\n",dataFrame2 # finding common rows between two DataFrames dfRes = pd.concat([dataFrame1, dataFrame2]) # reset index dfRes = dfRes.reset_index(drop=True) # groupby columns dfGroup = dfRes.groupby(list(dfRes.columns)) # length of each row to calculate the count # if count is greater than 1, that would mean common rows res = [k[0] for k in dfGroup.groups.values() if len(k) > 1] print"\nCommon rows...\n",dfRes.reindex(res)
ผลลัพธ์
สิ่งนี้จะสร้างผลลัพธ์ต่อไปนี้ -
DataFrame1 ... Car Reg_Price 0 BMW 1000 1 Lexus 1500 2 Audi 1100 3 Tesla 800 4 Bentley 1100 5 Jaguar 900 DataFrame2 ... Car Reg_Price 0 BMW 1200 1 Lexus 1500 2 Audi 1000 3 Tesla 800 4 Bentley 1100 5 Jaguar 1000 Common rows... Car Reg_Price 3 Tesla 800 1 Lexus 1500 4 Bentley 1100