ในบทความนี้ เราจะมาเรียนรู้เกี่ยวกับ Unicodedata – Unicode Database ใน Python 3.x หรือก่อนหน้านั้น
โมดูลฐานข้อมูลอักขระ Unicode ให้คุณลักษณะทั้งหมดของ Unicode แก่อักขระ โมดูลใช้ชื่อและสัญลักษณ์เหมือนกันตามที่กล่าวไว้ในโมดูล
ตอนนี้เรามาดูฟังก์ชันบางอย่างที่มีในโมดูลกัน
ฟังก์ชันการค้นหา
ฟังก์ชันนี้ช่วยให้เราได้รับสัญลักษณ์สำหรับชื่อที่เกี่ยวข้องที่ส่งผ่านในอินพุต
ตัวอย่าง
import unicodedata print (unicodedata.lookup('HYPHEN')) print (unicodedata.lookup('HIGH VOLTAGE SIGN') ) print (unicodedata.lookup('NO ENTRY') )
ผลลัพธ์
- ⚡
ฟังก์ชันชื่อ
ซึ่งช่วยให้เราดึงชื่อสัญลักษณ์ที่เกี่ยวข้องที่ส่งผ่านในอินพุตได้
ตัวอย่าง
import unicodedata print (unicodedata.name(u'&')) print (unicodedata.name(u'@') ) print (unicodedata.name(u'`') )
ผลลัพธ์
AMPERSAND COMMERCIAL AT GRAVE ACCENT
ฟังก์ชันหมวดหมู่
ซึ่งช่วยให้เราตรวจจับหมวดหมู่ของสัญลักษณ์/ตัวอักษร/จำนวนเต็มที่ส่งผ่านเป็นอินพุตได้
ตัวอย่าง
import unicodedata print (unicodedata.category(u'&')) print (unicodedata.category(u'1') ) print (unicodedata.category(u'a') )
ผลลัพธ์
Po Nd Ll
บทสรุป
ในบทความนี้ เราจะเรียนรู้เกี่ยวกับฐานข้อมูลอักขระ Unicode และฟังก์ชันที่เกี่ยวข้องบางส่วน