Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

Python - สร้างชุดข้อมูลทดสอบโดยใช้ Sklearn


ไลบรารี Sklearn python มีชุดข้อมูลตัวอย่างซึ่งสามารถใช้สร้างแผนภาพกราฟต่างๆ ประโยชน์ของชุดข้อมูลเหล่านี้คือการสร้างกราฟและแผนภูมิตัวอย่าง และคาดการณ์พฤติกรรมของกราฟเมื่อค่าต่างๆ เปลี่ยนแปลงไป นอกจากนี้ คุณยังสามารถทำงานกับพารามิเตอร์อื่นๆ เช่น การตัดสินใจเกี่ยวกับสีและแกน ฯลฯ ในกราฟตัวอย่างนี้ ก่อนที่จะใช้ชุดข้อมูลจริง

การใช้ make_blobs

ในตัวอย่างด้านล่าง เราใช้ไลบรารี sklearn ร่วมกับ matplotlib เพื่อสร้างพล็อตแบบกระจายที่มีสไตล์เฉพาะ เราเลือกตัวอย่างจุดข้อมูล 200 จุด และยังเลือกสีและประเภทของคลัสเตอร์อีกด้วย

ตัวอย่าง

from sklearn.datasets import make_blobs
from matplotlib import pyplot as plt
from matplotlib import style
style.use("fast")
X, y = make_blobs(n_samples=200, centers=,
                  cluster_std=1, n_features=2)

plt.scatter(X[:, 0], X[:, 1], s=60, color='r')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()
plt.clf()

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

Python - สร้างชุดข้อมูลทดสอบโดยใช้ Sklearn

การใช้ make_circles

คล้ายกับวิธีการข้างต้น เราใช้ฟังก์ชัน make_circles เพื่อสร้างวงกลมที่มีขนาดตัวอย่าง 100 และสีน้ำเงินเป็นสี

ตัวอย่าง

from sklearn.datasets import make_circles
from matplotlib import pyplot as plt
from matplotlib import style
style.use("fast")
X, y = make_circles(n_samples=100, noise=0.04)
plt.scatter(X[:, 0], X[:, 1], s=40, color='b')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()
plt.clf()

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

Python - สร้างชุดข้อมูลทดสอบโดยใช้ Sklearn