Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> Python

จะถอดรหัสไฟล์ PDF ใน Python ได้อย่างไร


Python มีคอลเลกชันที่หลากหลายของไลบรารีที่ใช้เพื่อวัตถุประสงค์หลายประการ เช่น การสร้างและพัฒนาแอปพลิเคชัน การพัฒนาเว็บ การคำนวณทางวิทยาศาสตร์ การทดสอบซอฟต์แวร์ การเรียนรู้ของเครื่อง และอื่นๆ อีกมากมาย Python ยังใช้สำหรับทดสอบและพัฒนาแอปพลิเคชันระบบในแง่ของความปลอดภัยของข้อมูล มีไลบรารีและเครื่องมืออื่นๆ อีกหลายตัวที่มีสคริปต์เฉพาะที่ใช้สำหรับสร้างแฮช การรวบรวมข้อมูล การดึงข้อมูล การเข้ารหัสและการถอดรหัส การรวบรวมข้อมูลเว็บ การปลอมแปลง และอื่นๆ อีกมากมาย

ในบทความนี้ เราจะสร้างโปรแกรมที่จะถอดรหัสเอกสาร PDF ที่ป้องกันด้วยรหัสผ่าน สำหรับการถอดรหัส เราจะใช้รายการคำที่มีรหัสผ่านทั่วไปและจะช่วยถอดรหัสเอกสาร pdf ได้

ในการสร้างแครกเกอร์ pdf เราจะนำเข้า pikepdf ห้องสมุด. เมื่อดาวน์โหลดแล้ว เราสามารถรวมไว้ในสมุดบันทึกของเราได้ สำหรับการอ้างอิง เราจะใช้รายการคำศัพท์นี้เป็นตัวอย่างที่มีรหัสผ่านทั่วไปถึง 5,000 รายการ

ตัวอย่าง

import pikepdf
from tqdm import tqdm

#Loading password list
password = [line.strip() for line in open("wordlist.txt")]

#iterate over all the passwords
for paswrd in tqdm(password, "Cracking PDF"):
   try:
      #open PDF file
      with pikepdf.open("protected.pdf", password=paswrd) as pdf:
#If password matches then break the loop and print the output
         print("Password found:", paswrd)
         break
   except pikepdf._qpdf.PasswordError as e:
      #If password not found then continue
      continue

ผลลัพธ์

การเรียกใช้โค้ดด้านบนจะพบรหัสผ่านก่อนแล้วจึงพิมพ์ออกมาเป็นเอาต์พุต

จะถอดรหัสไฟล์ PDF ใน Python ได้อย่างไร