Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

การจัดการ URL โมดูล Python (urllib)


ภาษา Python ถูกใช้อย่างกว้างขวางสำหรับการเขียนโปรแกรมเว็บ เมื่อเราเบราว์เซอร์เว็บไซต์ เราใช้ที่อยู่เว็บซึ่งเรียกอีกอย่างว่า URL หรือตัวระบุทรัพยากรแบบเดียวกัน Python มีวัสดุ inbuilt ซึ่งสามารถจัดการการเรียกไปยัง URL รวมทั้งส่งผลลัพธ์ที่มาจากการเยี่ยมชม URL ในบทความนี้ เราจะเห็นโมดูลชื่อ urllib . เราจะเห็นฟังก์ชันต่างๆ ที่มีอยู่ในโมดูลนี้ซึ่งช่วยในการรับผลลัพธ์จาก URL

การติดตั้ง urllib

ในการติดตั้ง urllib ในสภาพแวดล้อมของ python เราใช้คำสั่งด้านล่างโดยใช้ pip

pip ติดตั้ง urllib

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

การเปิด URL

เมธอด request.urlopen ใช้เพื่อเข้าชม URL และดึงเนื้อหาไปยังสภาพแวดล้อมของ python

ตัวอย่าง

นำเข้า urllib.requestaddress =urllib.request.urlopen('https://www.tutorialspoint.com/')print(address.read())

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

b'\r\n\r\n

urllib.parse

เราสามารถแยกวิเคราะห์ URL เพื่อตรวจสอบว่า URL นั้นถูกต้องหรือไม่ นอกจากนี้เรายังสามารถส่งสตริงการสืบค้นไปยังตัวเลือกการค้นหา สามารถตรวจสอบความถูกต้องของคำตอบได้ และเราสามารถพิมพ์คำตอบทั้งหมดได้หากคำตอบนั้นถูกต้อง

ตัวอย่าง

นำเข้า urllib.requestimport urllib.parseurl='https://tutorialspoint.com'values={'q':'python'}data =urllib.parse.urlencode(values)data =data.encode('utf- 8') # data ควรเป็น bytesprint(data)req =urllib.request.Request(url, data)resp =urllib.request.urlopen(req)print(resp)respData =resp.read()print(respData) 

ผลลัพธ์

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

b'q=python'b'\r\n

urllib.parse.urlsplit

urlsplit สามารถใช้เพื่อนำ url จากนั้นแยกออกเป็นส่วนๆ ซึ่งสามารถใช้สำหรับการจัดการข้อมูลเพิ่มเติม ตัวอย่างเช่น หากเราต้องการตัดสินโดยทางโปรแกรมว่า URL นั้นได้รับการรับรอง SSL หรือไม่ เราก็จะใช้ urlsplit และรับค่าโครงร่างเพื่อตัดสินใจ ในตัวอย่างด้านล่าง เราจะตรวจสอบส่วนต่างๆ ของ URL.X

. ที่ให้มา

ผลลัพธ์

นำเข้า urllib.parseurl='https://tutorialspoint.com/python'value =urllib.parse.urlsplit(url)print(value)

การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -

SplitResult(scheme='https', netloc='tutorialspoint.com', path='/python', query='', fragment='')