คำชี้แจงปัญหา − ใช้ไลบรารี boto3 ใน Python เพื่อดาวน์โหลดวัตถุจาก S3 ที่พาธในเครื่อง/พาธเริ่มต้นที่กำหนดโดยเขียนทับไฟล์ที่มีอยู่ว่าเป็นจริง เช่น ดาวน์โหลด test.zip จาก Bucket_1/testfolder ของ S3
แนวทาง/อัลกอริทึมในการแก้ปัญหานี้
ขั้นตอนที่ 1 - นำเข้าข้อยกเว้น boto3 และ botocore เพื่อจัดการกับข้อยกเว้น
ขั้นตอนที่ 2 − จาก pathlib , นำเข้าเส้นทางเพื่อตรวจสอบชื่อไฟล์
ขั้นตอนที่ 3 − s3_path, เส้นทางท้องถิ่น และ overwrite_existing_file คือสามพารามิเตอร์ในฟังก์ชัน download_object_from_s3
ขั้นตอนที่ 4 − ตรวจสอบ s3_path ถูกส่งผ่านในรูปแบบ AWS เป็น s3://bucket_name/key . โดยค่าเริ่มต้น localpath =ไม่มี และ overwrite_existing_file =True . ผู้ใช้สามารถส่งค่าเหล่านี้ได้เช่นกันเพื่อดาวน์โหลดในเส้นทางท้องถิ่นที่กำหนด
ขั้นตอนที่ 5 − สร้างเซสชัน AWS โดยใช้ไลบรารี boto3
ขั้นตอนที่ 6 − สร้างทรัพยากร AWS สำหรับ S3
ขั้นตอนที่ 7 − แยกพาธ S3 และดำเนินการเพื่อแยกชื่อรูทบัคเก็ตและพาธอ็อบเจ็กต์ที่จะดาวน์โหลด
ขั้นตอนที่ 8 − ตรวจสอบว่า overwrite_existing_file ตั้งค่าเป็นเท็จและไฟล์มีอยู่แล้วในเส้นทางท้องถิ่นที่กำหนด ในกรณีนี้ห้ามดำเนินการใดๆ
ขั้นตอนที่ 9 − อื่น ๆ (หากเงื่อนไขใด ๆ เหล่านี้ไม่เป็นความจริง) ให้ดาวน์โหลดวัตถุ หากได้รับ localpath ให้ดาวน์โหลดที่นั่น อื่นดาวน์โหลดลงในเส้นทางเริ่มต้น
ขั้นตอนที่ 10 − จัดการข้อยกเว้นตามรหัสตอบกลับเพื่อตรวจสอบว่าไฟล์ถูกดาวน์โหลดหรือไม่
ขั้นตอนที่ 11 − จัดการข้อยกเว้นทั่วไปหากมีข้อผิดพลาดขณะดาวน์โหลดไฟล์
ตัวอย่าง
ใช้รหัสต่อไปนี้เพื่อดาวน์โหลดไฟล์จาก AWS S3 -
import boto3 from botocore.exceptions import ClientError from pathlib import Path def download_object_from_s3(s3path, localPath=None, overwrite_existing_file=True): if 's3://' not in s3path: print('Given path is not a valid s3 path.') raise Exception('Given path is not a valid s3 path.') session = boto3.session.Session() s3_resource = session.resource('s3') s3_tokens = s3path.split('/') bucket_name = s3_tokens[2] object_path = "" filename = s3_tokens[len(s3_tokens) - 1] print('Filename: ' + filename) if len(s3_tokens) > 4: for tokn in range(3, len(s3_tokens) - 1): object_path += s3_tokens[tokn] + "/" object_path += filename else: object_path += filename print('object: ' + object_path) try: if not overwrite_existing_file and Path.is_file(filename): pass else: if localPath is None: s3_resource.meta.client.download_file(bucket_name, object_path, filename) else: s3_resource.meta.client.download_file(bucket_name, object_path, localPath + '/' + filename) print('Filename: ' + filename) return filename except ClientError as error: if error.response['Error']['Code'] == '404': print(s3path + " File not found: ") raise Exception(s3path + " File not found: ") except Exception as error: print("Unexpected error in download_object function of s3 helper: " + error.__str__()) raise Exception("Unexpected error in download_object function of s3 helper: " + error.__str__()) #Download into default localpath print(download_object_from_s3("s3://Bucket_1/testfolder/test.zip")) #Download into given path print(download_object_from_s3("s3://Bucket_1/testfolder/test.zip","C://AWS")) #File doesn’t exist in S3 print(download_object_from_s3("s3://Bucket_1/testfolder/abc.zip"))
ผลลัพธ์
#Download into default localpath Filename: test.zip object: testfolder/test.zip Filename: test.zip #Download into given path Filename: test.zip object: testfolder/test.zip Filename: test.zip #File doesn’t exist in S3 Filename: abc.zip object: testfolder/abc.zip s3://Bucket_1/testfolder/abc.zip File not found: botocore.exceptions.ClientError: An error occurred (404) when calling the HeadObject operation: Not Found
หมายเหตุ: เส้นทางเริ่มต้นที่จะดาวน์โหลดคือไดเร็กทอรีที่มีการเขียนฟังก์ชันนี้ ในไดเร็กทอรีเดียวกัน ไฟล์จะถูกดาวน์โหลดหากไม่มีการระบุพาธในเครื่อง
ตัวอย่างเช่น หากฟังก์ชันนี้เขียนลงใน S3_class และคลาสนี้มีอยู่ที่ C://AWS/src/S3_class ไฟล์ test.zip จะถูกดาวน์โหลดลงใน C://AWS/src/test.zip