Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

บทนำสู่การเรียนรู้ของเครื่องโดยใช้ Python


ในบทความนี้ เราจะเรียนรู้เกี่ยวกับพื้นฐานของการเรียนรู้ของเครื่องโดยใช้ Python 3.x หรือก่อนหน้านั้น

ขั้นแรก เราต้องใช้ไลบรารีที่มีอยู่เพื่อตั้งค่าสภาพแวดล้อมการเรียนรู้ของเครื่อง

>>> pip install numpy
>>> pip install scipy
>>> pip install matplotlib
>>> pip install scikit-learn

แมชชีนเลิร์นนิงเกี่ยวข้องกับการศึกษาประสบการณ์และข้อเท็จจริงและการทำนายโดยอิงจากความตั้งใจที่ให้ไว้ ยิ่งฐานข้อมูลมีขนาดใหญ่เท่าใด โมเดลการเรียนรู้ของเครื่องก็จะยิ่งดีขึ้นเท่านั้น

การไหลของแมชชีนเลิร์นนิง

  • ทำความสะอาดข้อมูล
  • การป้อนชุดข้อมูล
  • การฝึกโมเดล
  • การทดสอบชุดข้อมูล
  • การนำโมเดลไปใช้


บทนำสู่การเรียนรู้ของเครื่องโดยใช้ Python

ตอนนี้ มาระบุกันดีกว่าว่าห้องสมุดใดถูกใช้เพื่อจุดประสงค์ใด -

อ้วน − เพิ่มการรองรับรายการและเมทริกซ์ขนาดใหญ่ที่มีหลายมิติ พร้อมด้วยคอลเลกชันฟังก์ชันทางคณิตศาสตร์มากมายเพื่อใช้งานกับอาร์เรย์อินพุตเหล่านี้

SciPy - ไลบรารี Python แบบโอเพ่นซอร์สฟรีที่ใช้สำหรับการคำนวณทางวิทยาศาสตร์/คณิตศาสตร์ ประกอบด้วยโมดูลสำหรับการเพิ่มประสิทธิภาพของอัลกอริทึม การรวมข้อมูล การประมาณค่า ฟังก์ชันพิเศษบางอย่าง &พีชคณิตเชิงเส้น

Matplotlib − ห้องสมุดที่ใช้สร้างแผนภูมิและตัวเลข ช่วยให้สามารถวางแผนข้อมูลเพื่อให้ได้รับข้อมูลเชิงลึกที่ดีขึ้นในแบบจำลอง

Scikit-เรียนรู้ − มีอัลกอริธึมการจำแนกประเภท การจัดกลุ่ม และการถดถอยที่หลากหลายเพื่อแจกจ่ายและจัดระเบียบข้อมูลในลักษณะที่กำหนดไว้อย่างดี

ตอนนี้ มาสร้างโมเดลการเรียนรู้ของเครื่องขั้นพื้นฐานโดยใช้ scikit - เรียนรู้กันเถอะ ที่นี่เราจะนำชุดข้อมูลที่สร้างขึ้นมา เช่น ชุดข้อมูลม่านตาและตัวเลขที่มีอยู่ในชุดอุปกรณ์สกีเรียนรู้

from sklearn import datasets
iris = datasets.load_iris()
digits = datasets.load_digits()

ตอนนี้เพื่อดูข้อมูลจากชุดข้อมูลที่เราใช้

print(digits.data)


[[ 0. 0. 5. ... 0. 0. 0.]
[ 0. 0. 0. ... 10. 0. 0.]
[ 0. 0. 0. ... 16. 9. 0.]
...
[ 0. 0. 1. ... 6. 0. 0.]
[ 0. 0. 2. ... 12. 0. 0.]
[ 0. 0. 10. ... 12. 1. 0.]]

ฟังก์ชัน .target ช่วยให้เราเห็นสิ่งที่เราต้องการให้แบบจำลองของเราเรียนรู้

digits.target


array([0, 1, 2, ..., 8, 9, 8])

สำหรับการเข้าถึงรูปร่างของชุดข้อมูลตัวเลขที่เราใช้

digits.images[0]


array([[ 0., 0., 5., 13., 9., 1., 0., 0.],
   [ 0., 0., 13., 15., 10., 15., 5., 0.],
   [ 0., 3., 15., 2., 0., 11., 8., 0.],
   [ 0., 4., 12., 0., 0., 8., 8., 0.],
   [ 0., 5., 8., 0., 0., 9., 8., 0.],
   [ 0., 4., 11., 0., 1., 12., 7., 0.],
   [ 0., 2., 14., 5., 10., 12., 0., 0.],
   [ 0., 0., 6., 13., 10., 0., 0., 0.]])

มาต่อกันที่ส่วนการเรียนรู้และการทำนาย

from sklearn import svm
clf = svm.SVC(gamma=0.001, C=100.)

ที่นี่ SVC รองรับการจัดประเภทเวกเตอร์ซึ่งทำหน้าที่เป็นตัวประมาณในตัวสำหรับแบบจำลองของเรา

clf.fit(digits.data[:-1], digits.target[:-1])
SVC(C=100.0, cache_size=200, class_weight=None, coef0=0.0, decision_function_shape='ovr', degree=3, gamma=0.001,
kernel='rbf', max_iter=-1, probability=False, random_state=None,
shrinking=True, tol=0.001, verbose=False)

ขั้นแรก เราต้องฟีดโมเดลด้วยชุดข้อมูลโดยใช้วิธี fit เพื่อให้โมเดลของเราสามารถเรียนรู้ได้ที่นี่ เราฟีดรูปภาพทั้งหมดเป็นข้อมูลการฝึก ยกเว้นภาพสุดท้ายที่เราจะใช้สำหรับการทดสอบ

เมื่อโมเดลของเราได้รับการฝึกฝนแล้ว เราก็สามารถคาดการณ์ผลลัพธ์ของข้อมูลการทดสอบได้โดยใช้ฟังก์ชัน .predict

clf.predict(digits.data[-1:])
array([8])

เมื่อโมเดลของเราได้รับการฝึกฝนแล้ว เราก็สามารถคำนวณประสิทธิภาพและรอบเวลาของโมเดลของเราได้

บทสรุป

ในบทความนี้ เราได้เรียนรู้เกี่ยวกับพื้นฐานของแมชชีนเลิร์นนิงและไลบรารีพื้นฐานบางส่วนที่ใช้ในการติดตั้งใน Python