ภาษา Python ถูกใช้อย่างกว้างขวางสำหรับการเขียนโปรแกรมเว็บ เมื่อเราเบราว์เซอร์เว็บไซต์ เราใช้ที่อยู่เว็บซึ่งเรียกอีกอย่างว่า URL หรือตัวระบุทรัพยากรแบบเดียวกัน Python มีวัสดุ inbuilt ซึ่งสามารถจัดการการเรียกไปยัง URL รวมทั้งส่งผลลัพธ์ที่มาจากการเยี่ยมชม URL ในบทความนี้ เราจะเห็นโมดูลชื่อ urllib . เราจะเห็นฟังก์ชันต่างๆ ที่มีอยู่ในโมดูลนี้ซึ่งช่วยในการรับผลลัพธ์จาก URL
การติดตั้ง urllib
ในการติดตั้ง urllib ในสภาพแวดล้อมของ python เราใช้คำสั่งด้านล่างโดยใช้ pip
pip ติดตั้ง urllib
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
การเปิด URL
เมธอด request.urlopen ใช้เพื่อเข้าชม URL และดึงเนื้อหาไปยังสภาพแวดล้อมของ python
ตัวอย่าง
นำเข้า urllib.requestaddress =urllib.request.urlopen('https://www.tutorialspoint.com/')print(address.read())
ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
b'\r\n\r\n
urllib.parse
เราสามารถแยกวิเคราะห์ URL เพื่อตรวจสอบว่า URL นั้นถูกต้องหรือไม่ นอกจากนี้เรายังสามารถส่งสตริงการสืบค้นไปยังตัวเลือกการค้นหา สามารถตรวจสอบความถูกต้องของคำตอบได้ และเราสามารถพิมพ์คำตอบทั้งหมดได้หากคำตอบนั้นถูกต้อง
ตัวอย่าง
นำเข้า urllib.requestimport urllib.parseurl='https://tutorialspoint.com'values={'q':'python'}data =urllib.parse.urlencode(values)data =data.encode('utf- 8') # data ควรเป็น bytesprint(data)req =urllib.request.Request(url, data)resp =urllib.request.urlopen(req)print(resp)respData =resp.read()print(respData)ก่อน>ผลลัพธ์
การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
b'q=python'b'\r\n urllib.parse.urlsplit
urlsplit สามารถใช้เพื่อนำ url จากนั้นแยกออกเป็นส่วนๆ ซึ่งสามารถใช้สำหรับการจัดการข้อมูลเพิ่มเติม ตัวอย่างเช่น หากเราต้องการตัดสินโดยทางโปรแกรมว่า URL นั้นได้รับการรับรอง SSL หรือไม่ เราก็จะใช้ urlsplit และรับค่าโครงร่างเพื่อตัดสินใจ ในตัวอย่างด้านล่าง เราจะตรวจสอบส่วนต่างๆ ของ URL.X
. ที่ให้มาผลลัพธ์
นำเข้า urllib.parseurl='https://tutorialspoint.com/python'value =urllib.parse.urlsplit(url)print(value)การเรียกใช้โค้ดข้างต้นทำให้เราได้ผลลัพธ์ดังต่อไปนี้ -
SplitResult(scheme='https', netloc='tutorialspoint.com', path='/python', query='', fragment='')