ข้อมูลก่อนการประมวลผลหมายถึงการล้างข้อมูล การลบข้อมูลที่ไม่ถูกต้อง สัญญาณรบกวน การแทนที่ข้อมูลด้วยค่าที่เกี่ยวข้อง และอื่นๆ ไม่ได้หมายถึงข้อมูลข้อความเสมอไป อาจเป็นภาพหรือการประมวลผลวิดีโอได้เช่นกัน
โดยทั่วไปการประมวลผลข้อมูลล่วงหน้าหมายถึงงานในการรวบรวมข้อมูลทั้งหมด (ซึ่งรวบรวมจากแหล่งข้อมูลต่างๆ หรือทรัพยากรเดียว) ในรูปแบบทั่วไปหรือเป็นชุดข้อมูลเดียวกัน (ขึ้นอยู่กับประเภทของข้อมูล) เนื่องจากข้อมูลในโลกแห่งความเป็นจริงไม่เคยอยู่ในอุดมคติ จึงมีความเป็นไปได้ที่ข้อมูลนั้นจะไม่มีเซลล์ ข้อผิดพลาด ค่าผิดปกติ ความคลาดเคลื่อนในคอลัมน์ และอื่นๆ อีกมากมาย
บางครั้ง รูปภาพอาจจัดแนวไม่ถูกต้อง หรืออาจไม่ชัดเจน หรืออาจมีขนาดใหญ่มาก เป้าหมายของการประมวลผลล่วงหน้าคือการขจัดความคลาดเคลื่อนและข้อผิดพลาดเหล่านี้
ให้เรายกตัวอย่างการอัปโหลดรูปภาพและดูบนคอนโซลโดยใช้ไลบรารี scikit-learn -
ตัวอย่าง
from skimage import io path = "path to puppy.PNG" img = io.imread(path) print("Image being read") io.imshow(img) print("Image printed on console")
ผลลัพธ์
คำอธิบาย
- นำเข้าไลบรารีที่จำเป็น
- เส้นทางที่จัดเก็บภาพถูกกำหนดไว้
- ฟังก์ชัน 'imread' ใช้เพื่อเข้าชมเส้นทางและอ่านรูปภาพ
- หลังจากอ่านรูปภาพแล้ว ค่าพิกเซลจะถูกเก็บไว้ในรูปแบบของอาร์เรย์
- อาร์เรย์นี้ไม่ได้เป็นเพียงแค่อาร์เรย์ Numpy
- รูปภาพถูกอ่านและแปลงเป็นอาร์เรย์
- ใช้ฟังก์ชัน 'imshow' เพื่อแสดงรูปภาพบนคอนโซล
- ข้อมูลจะแสดงบนคอนโซล