ในบทช่วยสอนนี้ เราจะเรียนรู้เกี่ยวกับการวิเคราะห์ข้อมูลและการแสดงภาพโดยใช้โมดูล เช่น แพนด้า และ matplotlib ใน Python . Python เหมาะสมอย่างยิ่งกับการวิเคราะห์ข้อมูล ติดตั้งโมดูล แพนด้า และ matplotlib โดยใช้คำสั่งต่อไปนี้
pip install pandas
pip install matplotlib
คุณจะได้รับข้อความแสดงความสำเร็จหลังจากกระบวนการติดตั้งเสร็จสิ้น ก่อนอื่นเราจะเรียนรู้เกี่ยวกับแพนด้า แล้วจะเห็น matplotlib .
หมีแพนด้า
Pandas เป็นไลบรารีโอเพนซอร์ซของ Python ซึ่งมีเครื่องมือวิเคราะห์ข้อมูล เราจะมาดูวิธีการที่มีประโยชน์จาก แพนด้า เพื่อการวิเคราะห์ข้อมูล
การสร้าง DataFrame
เราต้องการหลายแถวเพื่อสร้าง DataFrame . มาดูวิธีทำกันเลย
ตัวอย่าง
# importing the pands package import pandas as pd # creating rows hafeez = ['Hafeez', 19] aslan = ['Aslan', 21] kareem = ['Kareem', 18] # pass those Series to the DataFrame # passing columns as well data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age']) # displaying the DataFrame print(data_frame)
ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
Name Age 0 Hafeez 19 1 Aslan 21 2 Kareem 18
การนำเข้าข้อมูลโดยใช้แพนด้า
ไปที่ลิงก์และดาวน์โหลด CSV ไฟล์. ข้อมูลใน CSV จะอยู่ในแถวโดยคั่นด้วยเครื่องหมายจุลภาค (,) มาดูวิธีการนำเข้าและใช้ข้อมูลโดยใช้ แพนด้า .
ตัวอย่าง
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # displaying the first 5 rows using data.head() method print(data.head())
ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
มาดูกันว่ามีกี่แถวและคอลัมน์ที่ใช้ตัวแปรรูปร่าง
ตัวอย่าง
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.shape)
ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
(29, 16)
เรามีวิธีการที่เรียกว่า describe() ซึ่งคำนวณสถิติต่างๆ ยกเว้น NaN . มาดูกันสักครั้ง
ตัวอย่าง
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.describe())
ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
พล็อตข้อมูล
เรามีแพ็คเกจ matplotlib เพื่อสร้างกราฟโดยใช้ข้อมูล มาดูวิธีการสร้างกราฟประเภทต่างๆ โดยใช้ matplotlib .
ตัวอย่าง
# importing the pyplot module to create graphs import matplotlib.pyplot as plot # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # creating a histogram of Time period data['Time period'].hist(bins = 10)
ผลลัพธ์
หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้
<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>
เราสามารถสร้างกราฟประเภทต่างๆ โดยใช้ matplotlib แพกเกจ
บทสรุป
หากคุณมีข้อสงสัยเกี่ยวกับบทแนะนำ โปรดระบุในส่วนความคิดเห็น