Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

TensorFlow สามารถใช้ดาวน์โหลดและสำรวจชุดข้อมูล Fashion MNIST โดยใช้ Python ได้อย่างไร


Tensorflow คือเฟรมเวิร์กแมชชีนเลิร์นนิงที่ให้บริการโดย Google เป็นเฟรมเวิร์กโอเพนซอร์ซที่ใช้ร่วมกับ Python เพื่อใช้อัลกอริทึม แอปพลิเคชันการเรียนรู้เชิงลึก และอื่นๆ อีกมากมาย ใช้ในการวิจัยและเพื่อการผลิต

แพ็คเกจ 'tensorflow' สามารถติดตั้งบน Windows ได้โดยใช้บรรทัดโค้ดด้านล่าง -

pip install tensorflow

ชุดข้อมูล 'Fashion MNIST' มีรูปภาพของเสื้อผ้าประเภทต่างๆ มันมีภาพสีเทาของเสื้อผ้ามากกว่า 70,000 ที่อยู่ใน 10 หมวดหมู่ที่แตกต่างกัน รูปภาพเหล่านี้มีความละเอียดต่ำ (28 x 28 พิกเซล)

เรากำลังใช้ Google Colaboratory เพื่อเรียกใช้โค้ดด้านล่าง Google Colab หรือ Colaboratory ช่วยเรียกใช้โค้ด Python บนเบราว์เซอร์และไม่ต้องมีการกำหนดค่าใดๆ และเข้าถึง GPU ได้ฟรี (หน่วยประมวลผลกราฟิก) Colaboratory ถูกสร้างขึ้นบน Jupyter Notebook

ต่อไปนี้เป็นรหัส -

ตัวอย่าง

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

print("The tensorflow version used is ")
print(tf.__version__)
print("The dataset is being loaded")
fashion_mnist = tf.keras.datasets.fashion_mnist
print("The dataset is being classified into training and testing data ")
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print("The dimensions of training data ")          
print(train_images.shape)

print("The number of rows in the training data")
print(len(train_labels))

print("The column names of dataset")
print(train_labels)
print("The dimensions of test data ")          
print(test_images.shape)
print("The number of rows in the test data")
print(len(test_labels))

เครดิตโค้ด − https://www.tensorflow.org/tutorials/keras/classification

ผลลัพธ์

The tensorflow version used is
2.4.0
The dataset is being loaded
The dataset is being classified into training and testing data
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
26427392/26421880 [==============================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
4423680/4422102 [==============================] - 0s 0us/step
The dimensions of training data
(60000, 28, 28)
The number of rows in the training data
60000
The column names of dataset
[9 0 0 ... 3 0 5]
The dimensions of test data
(10000, 28, 28)
The number of rows in the test data
10000

คำอธิบาย

  • แพ็คเกจที่จำเป็นจะถูกนำเข้า

  • กำหนดเวอร์ชันของ Tensorflow ที่ใช้แล้ว

  • โหลดชุดข้อมูล Fashion MNIST และเข้าถึงชุดข้อมูล Fashion MNIST ได้โดยตรงจาก TensorFlow

  • ต่อไป ข้อมูลจะแบ่งออกเป็นชุดข้อมูลการฝึกอบรมและการทดสอบ

  • มีทั้งหมด 70000 แถวในชุดข้อมูล ซึ่งใช้รูปภาพ 60,000 รูปสำหรับการฝึก และใช้ 10k เพื่อประเมินว่าโมเดลเรียนรู้วิธีจำแนกรูปภาพเป็นป้ายกำกับต่างๆ ได้ดีเพียงใด

  • นี่เป็นปัญหาการจัดหมวดหมู่ซึ่งทุกภาพจากชุดข้อมูลมีป้ายกำกับเฉพาะ

  • รูปภาพเหล่านี้เป็นภาพเสื้อผ้า และติดป้ายกำกับตามลำดับ

  • รูปร่าง จำนวนแถวในชุดข้อมูลการฝึกและทดสอบ และชื่อคอลัมน์ในชุดข้อมูลจะแสดงบนคอนโซล