ชุดข้อมูลดอกไม้สามารถประมวลผลล่วงหน้าได้โดยใช้ keras preprocessing API มีเมธอดชื่อ 'image_dataset_from_directory' ที่ใช้ชุดตรวจสอบความถูกต้อง ไดเร็กทอรีที่จัดเก็บข้อมูล และพารามิเตอร์อื่นๆ ในการประมวลผลชุดข้อมูล
อ่านเพิ่มเติม: TensorFlow คืออะไรและ Keras ทำงานร่วมกับ TensorFlow เพื่อสร้าง Neural Networks อย่างไร
เราจะใช้ Keras Sequential API ซึ่งมีประโยชน์ในการสร้างแบบจำลองตามลำดับที่ใช้ในการทำงานกับสแต็กเลเยอร์ธรรมดา โดยที่ทุกเลเยอร์มีอินพุทเทนเซอร์หนึ่งตัวและเอาท์พุทเทนเซอร์หนึ่งตัว ตัวแยกประเภทรูปภาพถูกสร้างขึ้นโดยใช้โมเดล keras.Sequential และโหลดข้อมูลโดยใช้ preprocessing.image_dataset_from_directory
ข้อมูลถูกโหลดออกจากดิสก์อย่างมีประสิทธิภาพ มีการระบุการใส่มากเกินไปและมีการใช้เทคนิคเพื่อบรรเทาปัญหาดังกล่าว เทคนิคเหล่านี้รวมถึงการเสริมข้อมูลและการออกกลางคัน มีภาพดอกไม้ 3700 ดอก ชุดข้อมูลนี้มีไดเร็กทอรีย่อย 5 ไดเร็กทอรี และมีไดเร็กทอรีย่อยหนึ่งไดเร็กทอรีต่อคลาส ได้แก่ เดซี่ ดอกแดนดิไลออน กุหลาบ ทานตะวัน และทิวลิป
เรากำลังใช้ Google Colaboratory เพื่อเรียกใช้โค้ดด้านล่าง Google Colab หรือ Colaboratory ช่วยเรียกใช้โค้ด Python บนเบราว์เซอร์และไม่ต้องมีการกำหนดค่าใดๆ และเข้าถึง GPU ได้ฟรี (หน่วยประมวลผลกราฟิก) Colaboratory ถูกสร้างขึ้นบน Jupyter Notebook
print("Pre-processing the dataset using keras.preprocessing") val_ds = tf.keras.preprocessing.image_dataset_from_directory( data_dir, validation_split=0.2, subset="validation", seed=123, image_size=(img_height, img_width), batch_size=batch_size) class_names = train_ds.class_names print("The class names are:") print(class_names)
เครดิตโค้ด:https://www.tensorflow.org/tutorials/images/classification
ผลลัพธ์
Pre-processing the dataset using keras.preprocessing Found 3670 files belonging to 5 classes. Using 734 files for validation. The class names are: ['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']
คำอธิบาย
- ชุดข้อมูลได้รับการประมวลผลโดยใช้วิธี keras.preprocessing
- ขั้นตอนต่อไปคือการแสดงชื่อคลาสบนคอนโซล