Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

Tensorflow สามารถใช้เตรียมชุดข้อมูลด้วยคำถาม stackoverflow โดยใช้ Python ได้อย่างไร


Tensorflow คือเฟรมเวิร์กแมชชีนเลิร์นนิงที่ให้บริการโดย Google เป็นเฟรมเวิร์กโอเพนซอร์สที่ใช้ร่วมกับ Python เพื่อใช้อัลกอริทึม แอปพลิเคชันการเรียนรู้เชิงลึก และอื่นๆ อีกมากมาย ใช้ในการวิจัยและเพื่อการผลิต

แพ็คเกจ 'tensorflow' สามารถติดตั้งบน Windows ได้โดยใช้บรรทัดโค้ดด้านล่าง -

pip ติดตั้งเทนเซอร์โฟลว์

Tensor เป็นโครงสร้างข้อมูลที่ใช้ใน TensorFlow ช่วยเชื่อมต่อขอบในแผนภาพการไหล แผนภาพการไหลนี้เรียกว่า 'กราฟการไหลของข้อมูล' เทนเซอร์เป็นเพียงอาร์เรย์หลายมิติหรือรายการ เรากำลังใช้ Google Colaboratory เพื่อเรียกใช้โค้ดด้านล่าง Google Colab หรือ Colaboratory ช่วยเรียกใช้โค้ด Python บนเบราว์เซอร์และไม่ต้องมีการกำหนดค่าใดๆ และเข้าถึง GPU ได้ฟรี (หน่วยประมวลผลกราฟิก) Colaboratory ถูกสร้างขึ้นบน Jupyter Notebook ต่อไปนี้เป็นข้อมูลโค้ด -

ตัวอย่าง

VOCAB_SIZE =10000print("การประมวลผลข้อความล่วงหน้าเริ่มต้นขึ้น")binary_vectorize_layer =TextVectorization ( max_tokens=VOCAB_SIZE, output_mode='binary')MAX_SEQUENCE_LENGTH =250int_vectorize_layer =TextVectorization( max_tokens=VOCAB_SIZE, output_mode='binary')MAX_SEQUENCE_LENGTH =250int_vectorize_layer =TextVectorization( max_tokens=outputVOCAB_SIZE,'LSE, /pre> 

เครดิตโค้ด – https://www.tensorflow.org/tutorials/load_data/text

ผลลัพธ์

การประมวลผลข้อความล่วงหน้าเริ่มต้นขึ้น

คำอธิบาย

  • ข้อมูลได้รับการกำหนดมาตรฐาน สร้างโทเค็น และแปลงเวกเตอร์โดยใช้เลเยอร์ "TextVectorization"

  • การกำหนดมาตรฐานเกี่ยวข้องกับการประมวลผลข้อความล่วงหน้าและการลบเครื่องหมายวรรคตอนและองค์ประกอบ HTML

  • Tokenization เกี่ยวข้องกับการแยกประโยคออกเป็นคำโดยแยกช่องว่าง

  • Vectorization เกี่ยวข้องกับการแปลงโทเค็นเป็นตัวเลขเพื่อให้สามารถเข้าใจเครือข่าย byneural เมื่อป้อนเข้าไป

  • โมเดลไบนารีใช้โมเดลแบบคำต่อคำเพื่อสร้างแบบจำลอง