ในบทความนี้ เราจะเรียนรู้เกี่ยวกับพื้นฐานของการเรียนรู้ของเครื่องโดยใช้ Python 3.x หรือก่อนหน้านั้น
ขั้นแรก เราต้องใช้ไลบรารีที่มีอยู่เพื่อตั้งค่าสภาพแวดล้อมการเรียนรู้ของเครื่อง
>>> pip install numpy >>> pip install scipy >>> pip install matplotlib >>> pip install scikit-learn
แมชชีนเลิร์นนิงเกี่ยวข้องกับการศึกษาประสบการณ์และข้อเท็จจริงและการทำนายโดยอิงจากความตั้งใจที่ให้ไว้ ยิ่งฐานข้อมูลมีขนาดใหญ่เท่าใด โมเดลการเรียนรู้ของเครื่องก็จะยิ่งดีขึ้นเท่านั้น
การไหลของแมชชีนเลิร์นนิง
- ทำความสะอาดข้อมูล
- การป้อนชุดข้อมูล
- การฝึกโมเดล
- การทดสอบชุดข้อมูล
- การนำโมเดลไปใช้
ตอนนี้ มาระบุกันดีกว่าว่าห้องสมุดใดถูกใช้เพื่อจุดประสงค์ใด -
อ้วน − เพิ่มการรองรับรายการและเมทริกซ์ขนาดใหญ่ที่มีหลายมิติ พร้อมด้วยคอลเลกชันฟังก์ชันทางคณิตศาสตร์มากมายเพื่อใช้งานกับอาร์เรย์อินพุตเหล่านี้
SciPy - ไลบรารี Python แบบโอเพ่นซอร์สฟรีที่ใช้สำหรับการคำนวณทางวิทยาศาสตร์/คณิตศาสตร์ ประกอบด้วยโมดูลสำหรับการเพิ่มประสิทธิภาพของอัลกอริทึม การรวมข้อมูล การประมาณค่า ฟังก์ชันพิเศษบางอย่าง &พีชคณิตเชิงเส้น
Matplotlib − ห้องสมุดที่ใช้สร้างแผนภูมิและตัวเลข ช่วยให้สามารถวางแผนข้อมูลเพื่อให้ได้รับข้อมูลเชิงลึกที่ดีขึ้นในแบบจำลอง
Scikit-เรียนรู้ − มีอัลกอริธึมการจำแนกประเภท การจัดกลุ่ม และการถดถอยที่หลากหลายเพื่อแจกจ่ายและจัดระเบียบข้อมูลในลักษณะที่กำหนดไว้อย่างดี
ตอนนี้ มาสร้างโมเดลการเรียนรู้ของเครื่องขั้นพื้นฐานโดยใช้ scikit - เรียนรู้กันเถอะ ที่นี่เราจะนำชุดข้อมูลที่สร้างขึ้นมา เช่น ชุดข้อมูลม่านตาและตัวเลขที่มีอยู่ในชุดอุปกรณ์สกีเรียนรู้
from sklearn import datasets iris = datasets.load_iris() digits = datasets.load_digits()
ตอนนี้เพื่อดูข้อมูลจากชุดข้อมูลที่เราใช้
print(digits.data)
[[ 0. 0. 5. ... 0. 0. 0.] [ 0. 0. 0. ... 10. 0. 0.] [ 0. 0. 0. ... 16. 9. 0.] ... [ 0. 0. 1. ... 6. 0. 0.] [ 0. 0. 2. ... 12. 0. 0.] [ 0. 0. 10. ... 12. 1. 0.]]
ฟังก์ชัน .target ช่วยให้เราเห็นสิ่งที่เราต้องการให้แบบจำลองของเราเรียนรู้
digits.target
array([0, 1, 2, ..., 8, 9, 8])
สำหรับการเข้าถึงรูปร่างของชุดข้อมูลตัวเลขที่เราใช้
digits.images[0]
array([[ 0., 0., 5., 13., 9., 1., 0., 0.], [ 0., 0., 13., 15., 10., 15., 5., 0.], [ 0., 3., 15., 2., 0., 11., 8., 0.], [ 0., 4., 12., 0., 0., 8., 8., 0.], [ 0., 5., 8., 0., 0., 9., 8., 0.], [ 0., 4., 11., 0., 1., 12., 7., 0.], [ 0., 2., 14., 5., 10., 12., 0., 0.], [ 0., 0., 6., 13., 10., 0., 0., 0.]])
มาต่อกันที่ส่วนการเรียนรู้และการทำนาย
from sklearn import svm clf = svm.SVC(gamma=0.001, C=100.)
ที่นี่ SVC รองรับการจัดประเภทเวกเตอร์ซึ่งทำหน้าที่เป็นตัวประมาณในตัวสำหรับแบบจำลองของเรา
clf.fit(digits.data[:-1], digits.target[:-1]) SVC(C=100.0, cache_size=200, class_weight=None, coef0=0.0, decision_function_shape='ovr', degree=3, gamma=0.001, kernel='rbf', max_iter=-1, probability=False, random_state=None, shrinking=True, tol=0.001, verbose=False)
ขั้นแรก เราต้องฟีดโมเดลด้วยชุดข้อมูลโดยใช้วิธี fit เพื่อให้โมเดลของเราสามารถเรียนรู้ได้ที่นี่ เราฟีดรูปภาพทั้งหมดเป็นข้อมูลการฝึก ยกเว้นภาพสุดท้ายที่เราจะใช้สำหรับการทดสอบ
เมื่อโมเดลของเราได้รับการฝึกฝนแล้ว เราก็สามารถคาดการณ์ผลลัพธ์ของข้อมูลการทดสอบได้โดยใช้ฟังก์ชัน .predict
clf.predict(digits.data[-1:]) array([8])
เมื่อโมเดลของเราได้รับการฝึกฝนแล้ว เราก็สามารถคำนวณประสิทธิภาพและรอบเวลาของโมเดลของเราได้
บทสรุป
ในบทความนี้ เราได้เรียนรู้เกี่ยวกับพื้นฐานของแมชชีนเลิร์นนิงและไลบรารีพื้นฐานบางส่วนที่ใช้ในการติดตั้งใน Python