ข้อมูลจะถูกทำให้เป็นมาตรฐานเพื่อคาดการณ์ประสิทธิภาพการใช้เชื้อเพลิงด้วยชุดข้อมูล Auto MPG โดยใช้ TensorFlow ได้อย่างไร

Tensorflow คือเฟรมเวิร์กแมชชีนเลิร์นนิงที่ให้บริการโดย Google เป็นเฟรมเวิร์กโอเพนซอร์ซที่ใช้ร่วมกับ Python เพื่อใช้อัลกอริทึม แอปพลิเคชันการเรียนรู้เชิงลึก และอื่นๆ อีกมากมาย แพ็คเกจ 'tensorflow' สามารถติดตั้งบน Windows ได้โดยใช้บรรทัดโค้ดด้านล่าง -

pip install tensorflow

Tensor เป็นโครงสร้างข้อมูลที่ใช้ใน TensorFlow ช่วยเชื่อมต่อขอบในแผนภาพการไหล แผนภาพการไหลนี้เรียกว่า 'กราฟการไหลของข้อมูล' เทนเซอร์เป็นเพียงอาร์เรย์หลายมิติหรือรายการ

เป้าหมายเบื้องหลังปัญหาการถดถอยคือการคาดการณ์ผลลัพธ์ของตัวแปรต่อเนื่องหรือตัวแปรที่ไม่ต่อเนื่อง เช่น ราคา ความน่าจะเป็น ฝนจะตกหรือไม่ เป็นต้น

ชุดข้อมูลที่เราใช้เรียกว่าชุดข้อมูล 'Auto MPG' ประกอบด้วยการประหยัดเชื้อเพลิงของรถยนต์ในยุค 1970 และ 1980 ซึ่งรวมถึงคุณลักษณะต่างๆ เช่น น้ำหนัก แรงม้า การกระจัด และอื่นๆ ด้วยเหตุนี้ เราจึงต้องคาดการณ์ประสิทธิภาพการใช้เชื้อเพลิงของรถยนต์แต่ละคัน

เรากำลังใช้ Google Colaboratory เพื่อเรียกใช้โค้ดด้านล่าง Google Colab หรือ Colaboratory ช่วยเรียกใช้โค้ด Python บนเบราว์เซอร์และไม่ต้องมีการกำหนดค่าใดๆ และเข้าถึง GPU ได้ฟรี (หน่วยประมวลผลกราฟิก) Colaboratory ถูกสร้างขึ้นบน Jupyter Notebook

ต่อไปนี้เป็นข้อมูลโค้ด -

ตัวอย่าง

print("Separating the label from features")
train_features = train_dataset.copy()
test_features = test_dataset.copy()

train_labels = train_features.pop('MPG')
test_labels = test_features.pop('MPG')
print("The mean and standard deviation of the training dataset : ")
train_dataset.describe().transpose()[['mean', 'std']]
print("Normalize the features since they use different scales")
print("Creating the normalization layer")
normalizer = preprocessing.Normalization()
normalizer.adapt(np.array(train_features))
print(normalizer.mean.numpy())
first = np.array(train_features[3:4])
print("Every feature has been individually normalized")
with np.printoptions(precision=2, suppress=True):
print('First example is :', first)
print()
print('Normalized data :', normalizer(first).numpy())

เครดิตโค้ด - https://www.tensorflow.org/tutorials/keras/regression

ผลลัพธ์

Separating the label from features
The mean and standard deviation of the training dataset :
Normalize the features since they use different scales
Creating the normalization layer
[ 5.467 193.847 104.135 2976.88 15.591 75.934 0.168 0.197
0.635]
Every feature has been individually normalized
First example is : [[ 4. 105. 63. 2125. 14.7 82. 0. 0. 1. ]]

Normalized data : [[−0.87 −0.87 −1.11 −1.03 −0.33 1.65 −0.45 −0.5 0.76]]

คำอธิบาย

ค่าเป้าหมาย (ฉลาก) แยกออกจากคุณสมบัติ
ป้ายกำกับคือค่าที่ต้องฝึกฝนเพื่อให้การคาดการณ์เกิดขึ้น
ฟีเจอร์ต่างๆ จะถูกปรับให้เป็นมาตรฐานเพื่อให้การฝึกมีความเสถียร
ฟังก์ชัน 'การทำให้เป็นมาตรฐาน' ใน Tensorflow จะประมวลผลข้อมูลล่วงหน้า
เลเยอร์แรกถูกสร้างขึ้น และค่าเฉลี่ยและความแปรปรวนจะถูกเก็บไว้ในเลเยอร์นี้
เมื่อเลเยอร์นี้ถูกเรียก มันจะส่งคืนข้อมูลที่ป้อนซึ่งทุกฟีเจอร์ได้รับการทำให้เป็นมาตรฐาน