Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

การวิเคราะห์ข้อมูลโดยใช้ Python Pandas


ในบทช่วยสอนนี้ เราจะมาดูการวิเคราะห์ข้อมูลโดยใช้ไลบรารี Python pandas ห้องสมุด แพนด้า เขียนด้วย C . ดังนั้นเราจึงไม่มีปัญหาเรื่องความเร็ว มีชื่อเสียงในด้านการวิเคราะห์ข้อมูล เรามีโครงสร้างการจัดเก็บข้อมูลสองประเภทในแพนด้า คือ ซีรีส์ และ DataFrame . มาดูกันทีละตัว

1.ซีรีส์

ซีรี่ส์คืออาร์เรย์ 1D ที่มีดัชนีและค่าที่กำหนดเอง เราสามารถสร้างวัตถุ Series โดยใช้ pandas.Series(data, index) ระดับ. ซีรีส์จะนำจำนวนเต็ม รายการ พจนานุกรมมาเป็นข้อมูล มาดูตัวอย่างกัน

ตัวอย่าง

# การนำเข้าไลบรารีแพนด้า นำเข้าแพนด้าเป็น pd# datadata =[1, 2, 3]# กำลังสร้าง Series object# Series จะใช้ indexseries เริ่มต้นโดยอัตโนมัติ =pd.Series(data)print(series)

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

0 11 22 3dtype:int64

จะมีดัชนีที่กำหนดเองได้อย่างไร? ดูตัวอย่าง

ตัวอย่าง

# กำลังนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# datadata =[1, 2, 3]# indexindex =['a', 'b', 'c']# การสร้าง Series objectseries =pd.Series (data, index) พิมพ์(ชุด)

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

a 1b 2c 3dtype:int64

เมื่อเราให้ข้อมูลเป็นพจนานุกรมแก่ ซีรีส์ class จากนั้นใช้คีย์เป็นดัชนีและค่าเป็นข้อมูลจริง มาดูตัวอย่างกัน

ตัวอย่าง

# การนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# datadata ={'a':97, 'b':98, 'c':99}# การสร้าง Series objectseries =pd.Series(data)print(series) 

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

a 97b 98c 99dtype:int64

เราสามารถเข้าถึงข้อมูลจาก Series โดยใช้ดัชนี มาดูตัวอย่างกัน

ตัวอย่าง

# การนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# datadata ={'a':97, 'b':98, 'c':99}# การสร้าง Series objectseries =pd.Series(data)# การเข้าถึงข้อมูลจาก ซีรีส์โดยใช้ indexesprint(series['a'], series['b'], series['c'])

ผลลัพธ์

หากคุณเรียกใช้โค้ดข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

97 98 99

2.แพนด้า

เรามีวิธีการใช้คลาส Series ในแพนด้า มาดูวิธีการใช้ DataFrame . กัน ระดับ. ดาต้าเฟรม คลาสโครงสร้างข้อมูลในแพนด้าที่มีแถวและคอลัมน์

เราสามารถสร้าง DataFrame วัตถุโดยใช้ รายการ พจนานุกรม ซีรีส์ เป็นต้น มาสร้าง DataFrame โดยใช้รายการกันเถอะ

ตัวอย่าง

# การนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# รายการชื่อ =['Tutorialspoint', 'Mohit', 'Sharma']ages =[25, 32, 21]# การสร้าง DataFramedata_frame =pd.DataFrame({'Name':ชื่อ 'อายุ':อายุ})# กำลังพิมพ์ DataFrameprint(data_frame)

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

 Name Age0 Tutorialspoint 251 Mohit 322 Sharma 21

มาดูวิธีการสร้าง data frame object โดยใช้ Series

ตัวอย่าง

# กำลังนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# กำลังสร้าง DataFramedata_frame =pd.DataFrame({"a":_1, "b":_2, "c":_3})# การพิมพ์ DataFrameprint(data_frame)

ผลลัพธ์

หากคุณเรียกใช้โค้ดข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

 a b c0 1 1 11 2 4 82 3 9 27

เราสามารถเข้าถึงข้อมูลจาก DataFrames โดยใช้ชื่อคอลัมน์ มาดูตัวอย่างกัน

ตัวอย่าง

# กำลังนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# การสร้าง DataFramedata_frame =pd.DataFrame({"a":_1, "b":_2, "c":_3})# การเข้าถึงทั้งคอลัมน์ด้วยชื่อ 'a'print(data_frame['a' ])

ผลลัพธ์

หากคุณเรียกใช้โค้ดด้านบน คุณจะได้ผลลัพธ์ดังต่อไปนี้

0 11 22 3ชื่อ:a, dtype:int64

บทสรุป

หากคุณมีข้อสงสัยใดๆ ในบทแนะนำ โปรดระบุในส่วนความคิดเห็น