ในบทช่วยสอนนี้ เราจะมาดูการวิเคราะห์ข้อมูลโดยใช้ไลบรารี Python pandas ห้องสมุด แพนด้า เขียนด้วย C . ดังนั้นเราจึงไม่มีปัญหาเรื่องความเร็ว มีชื่อเสียงในด้านการวิเคราะห์ข้อมูล เรามีโครงสร้างการจัดเก็บข้อมูลสองประเภทในแพนด้า คือ ซีรีส์ และ DataFrame . มาดูกันทีละตัว
1.ซีรีส์
ซีรี่ส์คืออาร์เรย์ 1D ที่มีดัชนีและค่าที่กำหนดเอง เราสามารถสร้างวัตถุ Series โดยใช้ pandas.Series(data, index) ระดับ. ซีรีส์จะนำจำนวนเต็ม รายการ พจนานุกรมมาเป็นข้อมูล มาดูตัวอย่างกัน
ตัวอย่าง
# การนำเข้าไลบรารีแพนด้า นำเข้าแพนด้าเป็น pd# datadata =[1, 2, 3]# กำลังสร้าง Series object# Series จะใช้ indexseries เริ่มต้นโดยอัตโนมัติ =pd.Series(data)print(series)
ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
0 11 22 3dtype:int64
จะมีดัชนีที่กำหนดเองได้อย่างไร? ดูตัวอย่าง
ตัวอย่าง
# กำลังนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# datadata =[1, 2, 3]# indexindex =['a', 'b', 'c']# การสร้าง Series objectseries =pd.Series (data, index) พิมพ์(ชุด)
ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
a 1b 2c 3dtype:int64
เมื่อเราให้ข้อมูลเป็นพจนานุกรมแก่ ซีรีส์ class จากนั้นใช้คีย์เป็นดัชนีและค่าเป็นข้อมูลจริง มาดูตัวอย่างกัน
ตัวอย่าง
# การนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# datadata ={'a':97, 'b':98, 'c':99}# การสร้าง Series objectseries =pd.Series(data)print(series)ก่อน>ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
a 97b 98c 99dtype:int64เราสามารถเข้าถึงข้อมูลจาก Series โดยใช้ดัชนี มาดูตัวอย่างกัน
ตัวอย่าง
# การนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# datadata ={'a':97, 'b':98, 'c':99}# การสร้าง Series objectseries =pd.Series(data)# การเข้าถึงข้อมูลจาก ซีรีส์โดยใช้ indexesprint(series['a'], series['b'], series['c'])ผลลัพธ์
หากคุณเรียกใช้โค้ดข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
97 98 992.แพนด้า
เรามีวิธีการใช้คลาส Series ในแพนด้า มาดูวิธีการใช้ DataFrame . กัน ระดับ. ดาต้าเฟรม คลาสโครงสร้างข้อมูลในแพนด้าที่มีแถวและคอลัมน์
เราสามารถสร้าง DataFrame วัตถุโดยใช้ รายการ พจนานุกรม ซีรีส์ เป็นต้น มาสร้าง DataFrame โดยใช้รายการกันเถอะ
ตัวอย่าง
# การนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# รายการชื่อ =['Tutorialspoint', 'Mohit', 'Sharma']ages =[25, 32, 21]# การสร้าง DataFramedata_frame =pd.DataFrame({'Name':ชื่อ 'อายุ':อายุ})# กำลังพิมพ์ DataFrameprint(data_frame)ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
Name Age0 Tutorialspoint 251 Mohit 322 Sharma 21มาดูวิธีการสร้าง data frame object โดยใช้ Series
ตัวอย่าง
# กำลังนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# กำลังสร้าง DataFramedata_frame =pd.DataFrame({"a":_1, "b":_2, "c":_3})# การพิมพ์ DataFrameprint(data_frame)ผลลัพธ์
หากคุณเรียกใช้โค้ดข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
a b c0 1 1 11 2 4 82 3 9 27เราสามารถเข้าถึงข้อมูลจาก DataFrames โดยใช้ชื่อคอลัมน์ มาดูตัวอย่างกัน
ตัวอย่าง
# กำลังนำเข้าไลบรารีแพนด้านำเข้าแพนด้าเป็น pd# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# การสร้าง DataFramedata_frame =pd.DataFrame({"a":_1, "b":_2, "c":_3})# การเข้าถึงทั้งคอลัมน์ด้วยชื่อ 'a'print(data_frame['a' ])ผลลัพธ์
หากคุณเรียกใช้โค้ดด้านบน คุณจะได้ผลลัพธ์ดังต่อไปนี้
0 11 22 3ชื่อ:a, dtype:int64บทสรุป
หากคุณมีข้อสงสัยใดๆ ในบทแนะนำ โปรดระบุในส่วนความคิดเห็น