Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

การก่อตัวของ Bigram จากรายการ Python ที่กำหนด


bigram เกิดขึ้นจากการสร้างคำสองคำจากทุก ๆ สองคำที่ต่อเนื่องกันจากประโยคที่กำหนด ใน python เทคนิคนี้ใช้อย่างมากในการวิเคราะห์ข้อความ ด้านล่างนี้ เราเห็นแนวทางสองวิธีในการบรรลุเป้าหมายนี้

การใช้การแจงนับและการแยก

ขั้นแรกเราใช้สองวิธีนี้แบ่งประโยคออกเป็นคำหลายๆ คำ แล้วใช้ฟังก์ชัน enumerate เพื่อสร้างคำคู่หนึ่งจากคำที่ต่อเนื่องกัน

ตัวอย่าง

list =['หยุด. มองซ้ายขวา go']print ("รายการที่กำหนดคือ:\n" + str(list))# การใช้ enumerate() และ split() สำหรับ Bigram formationoutput =[(k, m.split()[n + 1]) สำหรับ m ในรายการสำหรับ n, k ใน enumerate(m.split()) ถ้า n  

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

รายการที่กำหนดคือ :['Stop. มองซ้ายขวา go']รูปแบบ Bigram จากรายการที่กำหนดคือ:[('Stop.', 'look'), ('look', 'left'), ('left', 'right.'), ('right.', ' go')]

การใช้ zip() และ split()

นอกจากนี้เรายังสามารถสร้าง biagram โดยใช้ฟังก์ชัน zip และ split ฟังก์ชัน zip() จะจัดส่วนสิบของคำตามลำดับซึ่งสร้างขึ้นจากประโยคโดยใช้ split()

ตัวอย่าง

list =['หยุด. มองซ้ายขวา go']print ("รายการที่กำหนดคือ:\n" + str(list))# การใช้ zip() และ split() สำหรับ Bigram formationoutput =[m สำหรับ n ในรายการสำหรับ m ใน zip(n.split(" " )[:-1], n.split(" ")[1:])]print ("การสร้าง Bigram จากรายการที่กำหนดคือ:\n" + str(output))

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

รายการที่กำหนดคือ :['Stop. มองซ้ายขวา go']รูปแบบ Bigram จากรายการที่กำหนดคือ:[('Stop.', 'look'), ('look', 'left'), ('left', 'right.'), ('right.', ' go')]