bigram เกิดขึ้นจากการสร้างคำสองคำจากทุก ๆ สองคำที่ต่อเนื่องกันจากประโยคที่กำหนด ใน python เทคนิคนี้ใช้อย่างมากในการวิเคราะห์ข้อความ ด้านล่างนี้ เราเห็นแนวทางสองวิธีในการบรรลุเป้าหมายนี้
การใช้การแจงนับและการแยก
ขั้นแรกเราใช้สองวิธีนี้แบ่งประโยคออกเป็นคำหลายๆ คำ แล้วใช้ฟังก์ชัน enumerate เพื่อสร้างคำคู่หนึ่งจากคำที่ต่อเนื่องกัน
ตัวอย่าง
list =['หยุด. มองซ้ายขวา go']print ("รายการที่กำหนดคือ:\n" + str(list))# การใช้ enumerate() และ split() สำหรับ Bigram formationoutput =[(k, m.split()[n + 1]) สำหรับ m ในรายการสำหรับ n, k ใน enumerate(m.split()) ถ้า nผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
รายการที่กำหนดคือ :['Stop. มองซ้ายขวา go']รูปแบบ Bigram จากรายการที่กำหนดคือ:[('Stop.', 'look'), ('look', 'left'), ('left', 'right.'), ('right.', ' go')]การใช้ zip() และ split()
นอกจากนี้เรายังสามารถสร้าง biagram โดยใช้ฟังก์ชัน zip และ split ฟังก์ชัน zip() จะจัดส่วนสิบของคำตามลำดับซึ่งสร้างขึ้นจากประโยคโดยใช้ split()
ตัวอย่าง
list =['หยุด. มองซ้ายขวา go']print ("รายการที่กำหนดคือ:\n" + str(list))# การใช้ zip() และ split() สำหรับ Bigram formationoutput =[m สำหรับ n ในรายการสำหรับ m ใน zip(n.split(" " )[:-1], n.split(" ")[1:])]print ("การสร้าง Bigram จากรายการที่กำหนดคือ:\n" + str(output))ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
รายการที่กำหนดคือ :['Stop. มองซ้ายขวา go']รูปแบบ Bigram จากรายการที่กำหนดคือ:[('Stop.', 'look'), ('look', 'left'), ('left', 'right.'), ('right.', ' go')]