Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

การวิเคราะห์ข้อมูลและการแสดงภาพด้วยโปรแกรม Python


ในบทช่วยสอนนี้ เราจะเรียนรู้เกี่ยวกับการวิเคราะห์ข้อมูลและการแสดงภาพโดยใช้โมดูล เช่น แพนด้า และ matplotlib ใน Python . Python เหมาะสมอย่างยิ่งกับการวิเคราะห์ข้อมูล ติดตั้งโมดูล แพนด้า และ matplotlib โดยใช้คำสั่งต่อไปนี้

pip install pandas


pip install matplotlib

คุณจะได้รับข้อความแสดงความสำเร็จหลังจากกระบวนการติดตั้งเสร็จสิ้น ก่อนอื่นเราจะเรียนรู้เกี่ยวกับแพนด้า แล้วจะเห็น matplotlib .

หมีแพนด้า

Pandas เป็นไลบรารีโอเพนซอร์ซของ Python ซึ่งมีเครื่องมือวิเคราะห์ข้อมูล เราจะมาดูวิธีการที่มีประโยชน์จาก แพนด้า เพื่อการวิเคราะห์ข้อมูล

การสร้าง DataFrame

เราต้องการหลายแถวเพื่อสร้าง DataFrame . มาดูวิธีทำกันเลย

ตัวอย่าง

# importing the pands package
import pandas as pd
# creating rows
hafeez = ['Hafeez', 19]
aslan = ['Aslan', 21]
kareem = ['Kareem', 18]
# pass those Series to the DataFrame
# passing columns as well
data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age'])
# displaying the DataFrame
print(data_frame)

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

Name Age
0 Hafeez 19
1 Aslan 21
2 Kareem 18

การนำเข้าข้อมูลโดยใช้แพนด้า

ไปที่ลิงก์และดาวน์โหลด CSV ไฟล์. ข้อมูลใน CSV จะอยู่ในแถวโดยคั่นด้วยเครื่องหมายจุลภาค (,) มาดูวิธีการนำเข้าและใช้ข้อมูลโดยใช้ แพนด้า .

ตัวอย่าง

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# displaying the first 5 rows using data.head() method
print(data.head())

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

การวิเคราะห์ข้อมูลและการแสดงภาพด้วยโปรแกรม Python

มาดูกันว่ามีกี่แถวและคอลัมน์ที่ใช้ตัวแปรรูปร่าง

ตัวอย่าง

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.shape)

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

(29, 16)

เรามีวิธีการที่เรียกว่า describe() ซึ่งคำนวณสถิติต่างๆ ยกเว้น NaN . มาดูกันสักครั้ง

ตัวอย่าง

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.describe())

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

การวิเคราะห์ข้อมูลและการแสดงภาพด้วยโปรแกรม Python

พล็อตข้อมูล

เรามีแพ็คเกจ matplotlib เพื่อสร้างกราฟโดยใช้ข้อมูล มาดูวิธีการสร้างกราฟประเภทต่างๆ โดยใช้ matplotlib .

ตัวอย่าง

# importing the pyplot module to create graphs
import matplotlib.pyplot as plot
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# creating a histogram of Time period
data['Time period'].hist(bins = 10)

ผลลัพธ์

หากคุณเรียกใช้โปรแกรมข้างต้น คุณจะได้ผลลัพธ์ดังต่อไปนี้

<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>

การวิเคราะห์ข้อมูลและการแสดงภาพด้วยโปรแกรม Python

เราสามารถสร้างกราฟประเภทต่างๆ โดยใช้ matplotlib แพกเกจ

บทสรุป

หากคุณมีข้อสงสัยเกี่ยวกับบทแนะนำ โปรดระบุในส่วนความคิดเห็น