สเกลาร์สตริงที่เข้ารหัสสามารถแปลงเป็นเวกเตอร์ของจุดโค้ดโดยใช้วิธีการ 'ถอดรหัส' เวกเตอร์ของจุดโค้ดสามารถแปลงเป็นสเกลาร์สตริงที่เข้ารหัสได้โดยใช้วิธี "เข้ารหัส" สเกลาร์สตริงที่เข้ารหัสสามารถแปลงเป็นการเข้ารหัสอื่นได้โดยใช้วิธีการ "แปลง"
อ่านเพิ่มเติม:TensorFlow คืออะไรและ Keras ทำงานร่วมกับ TensorFlow เพื่อสร้าง Neural Networks ได้อย่างไร
ให้เราเข้าใจวิธีการแสดงสตริง Unicode โดยใช้ Python และจัดการกับสตริงที่ใช้ Unicode ที่เทียบเท่ากัน ขั้นแรก เราแยกสตริง Unicode เป็นโทเค็นตามการตรวจจับสคริปต์โดยใช้ Unicode ที่เทียบเท่ากับ ops สตริงมาตรฐาน
เรากำลังใช้ Google Colaboratory เพื่อเรียกใช้โค้ดด้านล่าง Google Colab หรือ Colaboratory ช่วยเรียกใช้โค้ด Python บนเบราว์เซอร์และไม่ต้องมีการกำหนดค่าใดๆ และเข้าถึง GPU ได้ฟรี (หน่วยประมวลผลกราฟิก) Colaboratory สร้างขึ้นบน Jupyter Notebook
print("Converting encoded string scalar to a vector of code points") tf.strings.unicode_decode(text_utf8,input_encoding='UTF-8') print("Converting vector of code points to an encoded string scalar") tf.strings.unicode_encode(text_chars, output_encoding='UTF-8') print("Converting encoded string scalar to a different encoding") tf.strings.unicode_transcode(text_utf8, input_encoding='UTF8', output_encoding='UTF-16-BE')
เครดิตโค้ด:https://www.tensorflow.org/tutorials/load_data/unicode
ผลลัพธ์
Converting encoded string scalar to a vector of code points Converting vector of code points to an encoded string scalar Converting encoded string scalar to a different encoding <tf.Tensor: shape=(), dtype=string, numpy=b'\x8b\xed\x8a\x00Y\x04t\x06'>
คำอธิบาย
- ฟังก์ชัน 'unicode_decode' ใช้เพื่อแปลงสเกลาร์สตริงที่เข้ารหัสเป็นเวกเตอร์ของจุดโค้ด
- ฟังก์ชัน 'unicode_encode' ใช้เพื่อแปลงเวกเตอร์ของโค้ดที่ชี้เป็นสเกลาร์สตริงที่เข้ารหัส
- ฟังก์ชัน 'unicode_transcode' ใช้เพื่อแปลงสเกลาร์สตริงที่เข้ารหัสเป็นการเข้ารหัสอื่น