python如何遍历文件夹下的文件夹

遍历文件夹下的文件夹的方法包括使用os模块、使用pathlib模块、递归遍历等。 本文将详细介绍这几种方法，并对其中的递归遍历进行详细描述。

递归遍历是一种强大的技术，尤其适用于处理嵌套文件夹结构。通过递归函数，我们可以在处理当前文件夹中的所有子文件夹时，调用自身来继续处理下一级文件夹。递归遍历的优势在于其代码简洁且易于理解，特别适合用于多层嵌套的文件夹结构。

一、OS模块的使用

Python的os模块提供了多种与操作系统交互的功能，其中包括遍历目录树的功能。下面是使用os模块来遍历文件夹下文件夹的具体方法。

1. 基本使用

os模块提供了os.listdir()方法来列出指定目录中的所有文件和文件夹。我们可以通过判断是否为目录来进行进一步的遍历。

import os
def list_dirs(path):
    for entry in os.listdir(path):
        full_path = os.path.join(path, entry)
        if os.path.isdir(full_path):
            print(f"Directory: {full_path}")
            list_dirs(full_path)  # 递归调用
        else:
            print(f"File: {full_path}")
示例调用
list_dirs('/path/to/your/folder')

2. 使用os.walk()

os.walk()是遍历目录树的另一种方法，它生成一个三元组，包含目录路径、该目录下的子目录列表和文件列表。

import os
def walk_dirs(path):
    for root, dirs, files in os.walk(path):
        for dir in dirs:
            print(f"Directory: {os.path.join(root, dir)}")
        for file in files:
            print(f"File: {os.path.join(root, file)}")
示例调用
walk_dirs('/path/to/your/folder')

二、Pathlib模块的使用

pathlib是Python 3.4引入的模块，用于面向对象地处理文件和目录路径。它提供了比os模块更直观和易用的API。

1. 基本使用

使用pathlib模块的Path对象可以方便地遍历目录。

from pathlib import Path
def list_dirs(path):
    path_obj = Path(path)
    for entry in path_obj.iterdir():
        if entry.is_dir():
            print(f"Directory: {entry}")
            list_dirs(entry)  # 递归调用
        else:
            print(f"File: {entry}")
示例调用
list_dirs('/path/to/your/folder')

2. 使用rglob方法

rglob()方法可以递归地搜索匹配特定模式的文件和文件夹。

from pathlib import Path
def list_dirs(path):
    path_obj = Path(path)
    for entry in path_obj.rglob('*'):
        if entry.is_dir():
            print(f"Directory: {entry}")
        else:
            print(f"File: {entry}")
示例调用
list_dirs('/path/to/your/folder')

三、递归遍历的详细描述

递归遍历是一种非常有效的遍历嵌套文件夹结构的方法。其核心思想是通过函数调用自身来处理子文件夹。下面是递归遍历的详细步骤和代码示例。

1. 核心思想

递归遍历的核心是一个递归函数，该函数会处理当前文件夹中的所有子文件夹和文件，并在遇到子文件夹时再次调用自身来处理子文件夹。这种方法的优势在于代码简洁且易于理解。

2. 代码实现

下面是一个详细的递归遍历示例，使用os模块来实现。

import os
def recursive_list_dirs(path):
    # 获取当前目录中的所有条目
    entries = os.listdir(path)
    for entry in entries:
        full_path = os.path.join(path, entry)
        # 如果是目录，递归调用自身
        if os.path.isdir(full_path):
            print(f"Directory: {full_path}")
            recursive_list_dirs(full_path)
        else:
            print(f"File: {full_path}")
示例调用
recursive_list_dirs('/path/to/your/folder')

3. 优势和应用

递归遍历的主要优势在于其代码简洁且易于扩展。通过递归函数，我们可以方便地处理任意层级的嵌套文件夹，而无需手动处理每一层。这使得递归遍历特别适用于处理复杂的文件夹结构，如备份系统、文件搜索工具等。

四、性能优化和注意事项

在实际应用中，遍历大规模文件夹结构可能会遇到性能问题和其他挑战。下面是一些优化建议和注意事项。

1. 性能优化

使用生成器：在处理大量文件和文件夹时，使用生成器可以减少内存消耗。os.walk()和pathlib中的rglob()方法都返回生成器。
并行处理：对于大规模文件夹，可以考虑使用多线程或多进程来加速遍历。

2. 错误处理

权限问题：在遍历文件夹时，可能会遇到权限问题。使用try-except块来处理这些异常，确保程序不会因为一个文件夹的权限问题而中断。

import os
def recursive_list_dirs(path):
    try:
        entries = os.listdir(path)
    except PermissionError:
        print(f"Permission denied: {path}")
        return
    for entry in entries:
        full_path = os.path.join(path, entry)
        if os.path.isdir(full_path):
            print(f"Directory: {full_path}")
            recursive_list_dirs(full_path)
        else:
            print(f"File: {full_path}")
示例调用
recursive_list_dirs('/path/to/your/folder')

3. 特殊文件处理

符号链接：在某些文件系统中，符号链接可能会导致递归陷入死循环。检查并处理符号链接可以避免这种情况。

import os
def recursive_list_dirs(path, visited=set()):
    try:
        entries = os.listdir(path)
    except PermissionError:
        print(f"Permission denied: {path}")
        return
    for entry in entries:
        full_path = os.path.join(path, entry)
        if os.path.islink(full_path):
            print(f"Symbolic link (skipped): {full_path}")
            continue
        if full_path in visited:
            print(f"Already visited (skipped): {full_path}")
            continue
        visited.add(full_path)
        if os.path.isdir(full_path):
            print(f"Directory: {full_path}")
            recursive_list_dirs(full_path, visited)
        else:
            print(f"File: {full_path}")
示例调用
recursive_list_dirs('/path/to/your/folder')

五、实际案例

为了更好地理解上述技术，让我们看一个实际案例：编写一个脚本，用于统计指定文件夹下所有文件的总大小。

import os
def get_total_size(path):
    total_size = 0
    def recursive_calculate_size(path):
        nonlocal total_size
        try:
            entries = os.listdir(path)
        except PermissionError:
            print(f"Permission denied: {path}")
            return
        for entry in entries:
            full_path = os.path.join(path, entry)
            if os.path.isdir(full_path):
                recursive_calculate_size(full_path)
            else:
                total_size += os.path.getsize(full_path)
    recursive_calculate_size(path)
    return total_size
示例调用
folder_path = '/path/to/your/folder'
print(f"Total size: {get_total_size(folder_path)} bytes")

这个脚本使用递归函数来遍历文件夹下的所有文件，并累加文件大小，最终返回总大小。

六、总结

遍历文件夹下的文件夹是一个常见的任务，通过使用Python的os模块和pathlib模块，我们可以方便地实现这一功能。递归遍历是一种特别有效的方法，代码简洁且易于理解。本文还介绍了性能优化和错误处理的建议，以及一个实际应用案例。希望这些内容能帮助你更好地掌握文件夹遍历技术。

推荐使用研发项目管理系统PingCode和通用项目管理软件Worktile来管理和跟踪你的项目，以提高项目管理的效率和准确性。

python如何遍历文件夹下的文件夹

一、OS模块的使用

1. 基本使用

示例调用

2. 使用os.walk()

示例调用

二、Pathlib模块的使用

1. 基本使用

示例调用

2. 使用rglob方法

示例调用

三、递归遍历的详细描述

1. 核心思想

2. 代码实现

示例调用

3. 优势和应用

四、性能优化和注意事项

1. 性能优化

2. 错误处理

示例调用

3. 特殊文件处理

示例调用

五、实际案例

示例调用

六、总结

相关问答FAQs：