oss2 python 如何上传一个文件夹

一、在OSS2中使用Python上传一个文件夹的方法

要在OSS2中使用Python上传一个文件夹，你需要使用oss2库、递归遍历文件夹、逐个上传文件。具体来说，首先需要安装并配置必要的环境，然后编写脚本来执行文件上传操作。通过递归遍历文件夹，可以确保文件夹中的每个文件都被正确上传。

安装和配置环境：

在开始编写代码之前，需要确保已安装oss2库并配置好所需的OSS访问凭证。你可以使用以下命令来安装oss2库：

pip install oss2

接下来，我们详细介绍如何在Python中使用oss2库实现上传文件夹的操作。

二、安装与配置OSS2库

1、安装oss2库

在开始上传文件夹之前，你需要确保你的Python环境中已安装oss2库。你可以通过pip命令来安装它：

pip install oss2

2、获取OSS访问凭证

为了与OSS进行交互，你需要获取访问凭证，包括AccessKeyId和AccessKeySecret。这些凭证可以从阿里云的控制台获得。你还需要知道你的OSS Bucket名称和Endpoint。

3、配置OSS客户端

在Python脚本中，你需要配置OSS客户端来进行认证和连接。以下是一个简单的示例代码，展示了如何配置OSS客户端：

import oss2
配置访问凭证
auth = oss2.Auth('<AccessKeyId>', '<AccessKeySecret>')
bucket = oss2.Bucket(auth, '<Endpoint>', '<BucketName>')

三、递归遍历文件夹

1、使用os.walk遍历文件夹

为了上传文件夹中的所有文件，你需要递归遍历文件夹。os.walk是一个非常有用的函数，它可以生成目录树中的文件名。以下是一个简单的示例代码，展示了如何使用os.walk遍历文件夹：

import os
def traverse_directory(directory):
    for root, dirs, files in os.walk(directory):
        for file in files:
            file_path = os.path.join(root, file)
            print(file_path)
示例调用
traverse_directory('/path/to/your/folder')

2、获取相对路径

在上传文件时，你通常希望保留文件的相对路径。因此，你需要计算文件的相对路径。以下是如何计算相对路径的示例代码：

import os
def get_relative_path(base_path, file_path):
    return os.path.relpath(file_path, base_path)
示例调用
base_path = '/path/to/your/folder'
file_path = '/path/to/your/folder/subfolder/file.txt'
relative_path = get_relative_path(base_path, file_path)
print(relative_path)

四、上传文件到OSS

1、上传单个文件

使用oss2库上传单个文件非常简单。以下是一个示例代码，展示了如何上传单个文件：

import oss2
def upload_file(bucket, file_path, object_name):
    with open(file_path, 'rb') as fileobj:
        bucket.put_object(object_name, fileobj)
示例调用
upload_file(bucket, '/path/to/your/file.txt', 'folder/file.txt')

2、上传文件夹中的所有文件

结合前面的内容，你可以编写一个完整的脚本，递归遍历文件夹并上传文件。以下是一个完整的示例代码：

import os
import oss2
def upload_folder(bucket, folder_path):
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            file_path = os.path.join(root, file)
            object_name = os.path.relpath(file_path, folder_path)
            upload_file(bucket, file_path, object_name)
            print(f'Uploaded {file_path} to {object_name}')
配置访问凭证
auth = oss2.Auth('<AccessKeyId>', '<AccessKeySecret>')
bucket = oss2.Bucket(auth, '<Endpoint>', '<BucketName>')
上传文件夹
upload_folder(bucket, '/path/to/your/folder')

3、处理大文件上传

对于大文件，你可能需要使用分片上传（Multipart Upload）来提高上传效率。以下是一个简单的示例代码，展示了如何使用oss2库进行分片上传：

import oss2
def multipart_upload(bucket, file_path, object_name, part_size=10 * 1024 * 1024):
    total_size = os.path.getsize(file_path)
    part_count = (total_size + part_size - 1) // part_size
    upload_id = bucket.init_multipart_upload(object_name).upload_id
    parts = []
    with open(file_path, 'rb') as fileobj:
        for i in range(part_count):
            offset = i * part_size
            remAIning_size = total_size - offset
            size = min(part_size, remaining_size)
            part_number = i + 1
            result = bucket.upload_part(object_name, upload_id, part_number, oss2.models.SizedFileAdapter(fileobj, size))
            parts.append(oss2.models.PartInfo(part_number, result.etag))
    bucket.complete_multipart_upload(object_name, upload_id, parts)
    print(f'Multipart uploaded {file_path} to {object_name}')
示例调用
multipart_upload(bucket, '/path/to/large/file.txt', 'folder/large_file.txt')

五、异常处理与日志记录

1、异常处理

在实际应用中，你需要处理各种可能的异常情况，例如网络问题、权限问题等。以下是一个简单的示例代码，展示了如何进行异常处理：

import oss2
import logging
def upload_file_with_exception_handling(bucket, file_path, object_name):
    try:
        with open(file_path, 'rb') as fileobj:
            bucket.put_object(object_name, fileobj)
        print(f'Successfully uploaded {file_path} to {object_name}')
    except oss2.exceptions.OssError as e:
        logging.error(f'Failed to upload {file_path} to {object_name}: {e}')
示例调用
upload_file_with_exception_handling(bucket, '/path/to/your/file.txt', 'folder/file.txt')

2、日志记录

为了方便调试和监控，你可以使用Python的logging库记录日志。以下是一个简单的示例代码，展示了如何配置和使用日志记录：

import logging
配置日志记录
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
def upload_file_with_logging(bucket, file_path, object_name):
    try:
        with open(file_path, 'rb') as fileobj:
            bucket.put_object(object_name, fileobj)
        logging.info(f'Successfully uploaded {file_path} to {object_name}')
    except oss2.exceptions.OssError as e:
        logging.error(f'Failed to upload {file_path} to {object_name}: {e}')
示例调用
upload_file_with_logging(bucket, '/path/to/your/file.txt', 'folder/file.txt')

六、优化上传性能

1、并发上传

为了提高上传性能，你可以使用并发上传。你可以使用Python的多线程或多进程库来实现并发上传。以下是一个简单的示例代码，展示了如何使用多线程进行并发上传：

import os
import oss2
import threading
def upload_file_thread(bucket, file_path, object_name):
    with open(file_path, 'rb') as fileobj:
        bucket.put_object(object_name, fileobj)
    print(f'Successfully uploaded {file_path} to {object_name}')
def upload_folder_concurrent(bucket, folder_path, thread_count=4):
    files_to_upload = []
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            file_path = os.path.join(root, file)
            object_name = os.path.relpath(file_path, folder_path)
            files_to_upload.append((file_path, object_name))
    def worker():
        while files_to_upload:
            file_path, object_name = files_to_upload.pop()
            upload_file_thread(bucket, file_path, object_name)
    threads = []
    for _ in range(thread_count):
        thread = threading.Thread(target=worker)
        threads.append(thread)
        thread.start()
    for thread in threads:
        thread.join()
示例调用
upload_folder_concurrent(bucket, '/path/to/your/folder')

2、分片上传优化

分片上传可以显著提高上传大文件的效率。你可以调整分片大小和并发数来优化性能。以下是一个示例代码，展示了如何优化分片上传：

import oss2
def optimized_multipart_upload(bucket, file_path, object_name, part_size=10 * 1024 * 1024, thread_count=4):
    total_size = os.path.getsize(file_path)
    part_count = (total_size + part_size - 1) // part_size
    upload_id = bucket.init_multipart_upload(object_name).upload_id
    parts = []
    def upload_part(part_number, offset):
        with open(file_path, 'rb') as fileobj:
            fileobj.seek(offset)
            size = min(part_size, total_size - offset)
            result = bucket.upload_part(object_name, upload_id, part_number, oss2.models.SizedFileAdapter(fileobj, size))
            parts.append(oss2.models.PartInfo(part_number, result.etag))
    threads = []
    for i in range(part_count):
        offset = i * part_size
        part_number = i + 1
        thread = threading.Thread(target=upload_part, args=(part_number, offset))
        threads.append(thread)
        thread.start()
    for thread in threads:
        thread.join()
    bucket.complete_multipart_upload(object_name, upload_id, parts)
    print(f'Multipart uploaded {file_path} to {object_name}')
示例调用
optimized_multipart_upload(bucket, '/path/to/large/file.txt', 'folder/large_file.txt')