คู่มือนี้จะสอนคุณทีละขั้นตอนถึงวิธีการดาวน์โหลดไฟล์จากบรรทัดคำสั่งใน Linux, Windows หรือ macOS โดยใช้ซอฟต์แวร์โอเพ่นซอร์ส (ฟรี) - wget Wget เป็นเครื่องมือดาวน์โหลดบรรทัดคำสั่งที่ยอดเยี่ยมมากสำหรับสภาพแวดล้อม Linux และ UNIX ที่ได้รับการพอร์ตไปยัง Windows และ macOS อย่าหลงกลโดยความจริงที่ว่ามันเป็นเครื่องมือบรรทัดคำสั่ง มันทรงพลังและใช้งานได้หลากหลายและสามารถจับคู่ตัวดาวน์โหลดกราฟิกที่ดีที่สุดบางตัวในปัจจุบัน มีคุณสมบัติต่างๆ เช่น การดาวน์โหลดต่อ การควบคุมแบนด์วิดท์ สามารถจัดการการตรวจสอบสิทธิ์ และอื่นๆ อีกมากมาย ฉันจะให้คุณเริ่มต้นด้วยพื้นฐานการใช้ wget จากนั้นฉันจะแสดงให้คุณเห็นว่าคุณสามารถสำรองข้อมูลเว็บไซต์ของคุณโดยอัตโนมัติโดยใช้ wget ได้อย่างไร และ ครอน .
เริ่มต้นด้วยการติดตั้ง wget ลีนุกซ์ส่วนใหญ่มาพร้อมกับ wget ที่ติดตั้งไว้ล่วงหน้า หากคุณสามารถลงเครื่อง Linux ได้โดยไม่ต้องใช้ wget ให้ลองทำสิ่งต่อไปนี้ บนระบบที่ใช้ Red Hat Linux เช่น Fedora คุณสามารถใช้:
# yum ติดตั้ง wget
หรือถ้าคุณใช้ระบบที่ใช้ Debian เช่น Ubuntu:
# sudo apt-get install wget
หนึ่งในนั้นควรทำเคล็ดลับสำหรับคุณ มิฉะนั้น ให้ตรวจสอบกับคู่มือการแจกจ่าย Linux ของคุณเพื่อดูวิธีรับและติดตั้งแพ็คเกจ ผู้ใช้บน Windows สามารถเข้าถึง wget ผ่านทางเว็บไซต์นี้ได้ และสำหรับผู้ใช้ Mac เรามีคำแนะนำฉบับสมบูรณ์เกี่ยวกับวิธีการติดตั้ง wget ใน macOS
การดำเนินการขั้นพื้นฐานที่สุดที่ตัวจัดการการดาวน์โหลดต้องทำคือการดาวน์โหลดไฟล์จาก URL นี่คือวิธีที่คุณจะใช้ wget เพื่อดาวน์โหลดไฟล์:
# wget https://www.simplehelp.net/images/file.zip
ใช่ มันง่ายมาก ตอนนี้เรามาทำอะไรสนุกๆ กันดีกว่า มาดาวน์โหลดทั้งเว็บไซต์กัน นี่คือรสชาติของพลังของ wget หากคุณต้องการดาวน์โหลดเว็บไซต์ คุณสามารถระบุความลึกที่ wget ต้องดึงไฟล์ออกมา สมมติว่าคุณต้องการดาวน์โหลดลิงก์ระดับแรกของหน้าแรกของ Yahoo! นี่คือวิธีการ:
# wget -r -l 1 https://www.yahoo.com/
นี่คือสิ่งที่แต่ละตัวเลือกทำ -r เปิดใช้งานการเรียกซ้ำของไฟล์ -l หมายถึงระดับและตัวเลข 1 ถัดจากนั้นจะบอก wget ว่าจะต้องไปกี่ระดับในขณะที่ดึงไฟล์ ลองเพิ่มจำนวนระดับเป็นสองระดับและดูว่า wget ใช้เวลานานเท่าใด
ตอนนี้ ถ้าคุณต้องการดาวน์โหลดภาพ "jpeg" ทั้งหมดจากเว็บไซต์ ผู้ใช้ที่คุ้นเคยกับบรรทัดคำสั่งของ Linux อาจเดาได้ว่าคำสั่งเช่น "wget https://www.sevencross.com*.jpeg" จะใช้งานได้ น่าเสียดายที่มันจะไม่เป็นเช่นนั้น สิ่งที่คุณต้องทำมีดังนี้:
# wget -r -l1 –no-parent -A.jpeg https://www.yahoo.com
อีกตัวเลือกที่มีประโยชน์มากใน wget คือการเริ่มดาวน์โหลดใหม่ สมมติว่าคุณเริ่มดาวน์โหลดไฟล์ขนาดใหญ่และสูญเสียการเชื่อมต่ออินเทอร์เน็ตก่อนที่การดาวน์โหลดจะเสร็จสิ้น คุณสามารถใช้ -c ตัวเลือกในการดาวน์โหลดต่อจากที่ค้างไว้
# wget -c https://www.example_url.com/ubuntu-live.iso
ตอนนี้เรามาตั้งค่าการสำรองข้อมูลรายวันของเว็บไซต์กัน คำสั่งต่อไปนี้จะสร้างมิเรอร์ของไซต์ในดิสก์ในเครื่องของคุณ เพื่อจุดประสงค์นี้ wget มีตัวเลือกเฉพาะ –mirror . ลองใช้คำสั่งต่อไปนี้ โดยแทนที่ Sevencross.com ด้วยที่อยู่เว็บไซต์ของคุณ
# wget –mirror https://www.sevencross.com/
เมื่อรันคำสั่งเสร็จแล้ว คุณควรมีมิเรอร์ในเครื่องของเว็บไซต์ของคุณ ทำให้เป็นเครื่องมือที่ค่อนข้างสะดวกสำหรับการสำรองข้อมูล มาเปลี่ยนคำสั่งนี้เป็นเชลล์สคริปต์สุดเจ๋งและกำหนดเวลาให้รันตอนเที่ยงคืนทุกคืน เปิดตัวแก้ไขข้อความที่คุณชื่นชอบแล้วพิมพ์ดังต่อไปนี้ อย่าลืมปรับเส้นทางของข้อมูลสำรองและ URL ของเว็บไซต์ให้ตรงกับความต้องการของคุณ
#!/bin/bash
YEAR=`date +”%Y”`
MONTH=`date +”%m”`
DAY=`date +”%d”`BACKUP_PATH=`/home/backup/` # แทนที่เส้นทางด้วยไดเรกทอรีสำรองของคุณ
WEBSITE_URL=`https://www.sevenacross.net` # แทนที่ url ด้วยที่อยู่ของเว็บไซต์ที่คุณต้องการสำรองข้อมูล# สร้างและย้ายไปยังไดเร็กทอรีสำรอง
cd $BACKUP_PARENT_DIR/$YEAR/$MONTH
mkdir $DAY
cd $DAYwget –mirror ${WEBSITE_URL}
ตอนนี้บันทึกไฟล์นี้เป็นบางอย่างเช่น website_backup.sh และให้สิทธิ์ปฏิบัติการ:
# chmod +x เว็บไซต์_backup.sh
เปิดการกำหนดค่า cron ของคุณด้วย crontab คำสั่งและเพิ่มบรรทัดต่อไปนี้ในตอนท้าย:
0 0 * * * /path/to/website_backup.sh
คุณควรมีสำเนาเว็บไซต์ของคุณใน /home/backup/YEAR/MONTH/DAY ทุกวัน. หากต้องการความช่วยเหลือเพิ่มเติมในการใช้ cron และ crontab โปรดดูบทช่วยสอนนี้
เมื่อคุณได้รับข้อมูลพื้นฐานในการดาวน์โหลดไฟล์จากบรรทัดคำสั่งแล้ว คุณสามารถเข้าสู่เนื้อหาขั้นสูงได้โดยการอ่าน man page ของ wget – เพียงพิมพ์ man wget จากบรรทัดคำสั่ง