Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

จะลบแท็กเปล่าโดยใช้ BeautifulSoup ใน Python ได้อย่างไร


BeautifulSoup เป็นไลบรารี่ python ที่ดึงข้อมูลจากไฟล์ HTML และ XML การใช้ BeautifulSoup เรายังสามารถลบแท็กว่างที่มีอยู่ในเอกสาร HTML หรือ XML และแปลงข้อมูลที่กำหนดให้เป็นมนุษย์ต่อไป ไฟล์ที่อ่านได้

ขั้นแรก เราจะติดตั้งไลบรารี BeautifulSoup ในสภาพแวดล้อมท้องถิ่นของเราโดยใช้คำสั่ง:pip install beautifulsoup4

ตัวอย่าง

#Import the BeautifulSoup library

from bs4 import BeautifulSoup

#Get the html document
html_object = """
<p>Python is an interpreted, high-level and general-purpose
programming language. Python's design
philosophy emphasizes code readability with its notable use of
significant indentation.</p>
"""

#Let us create the soup for the given html document
soup = BeautifulSoup(html_object, "lxml")

#Iterate over each line of the document and extract the data
for x in soup.find_all():
   if len(x.get_text(strip=True)) == 0:
      x.extract()

print(soup)

ผลลัพธ์

การเรียกใช้โค้ดด้านบนจะสร้างเอาต์พุตและแปลงเอกสาร HTML ที่กำหนดให้เป็นโค้ดที่มนุษย์อ่านได้โดยการลบแท็กว่างในนั้น

<html><body><p>Python is an interpreted, high−level and general−purpose programming
language. Python's design
philosophy emphasizes code readability with its notable use of significant indentation.</p>
</body></html>