「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > Python でサブフォルダーを再帰的に検索してファイルを取得する方法

Python でサブフォルダーを再帰的に検索してファイルを取得する方法

2024 年 11 月 16 日に公開
ブラウズ:827

How to Recursively Search Sub-Folders and Retrieve Files in Python?

再帰的サブフォルダー検索とファイル取得

プログラミングの領域では、ディレクトリを走査してファイルを取得するのが一般的なタスクとなることがあります。効率的なアプローチの 1 つは、再帰アルゴリズムを使用してサブフォルダーを検索し、特定の基準を満たすファイルのリストを蓄積することです。

問題が発生しました

ユーザーが障害に遭遇しました再帰的なサブフォルダー検索で特定のファイルのリストを作成しようとしているとき。この問題は、ファイルを含む現在のフォルダーではなく、サブフォルダー変数がサブフォルダーのリストを取得することで発生しました。

サブフォルダーの目的

サブフォルダー変数は、次の目的を保持することを目的としています。目的のファイルが保存されているメインフォルダーの下のサブフォルダーの名前located.

解決策

この問題を解決する鍵は、「subFolder」の代わりに「root」または「dirpath」変数を利用することにあります。この変数は、再帰中にトラバースされる現在のディレクトリへの絶対パスを保持します。このパスを fileNamePath の構築に組み込むことで、望ましい精度を達成できます。

import os
result = [os.path.join(dp, f) for dp, dn, filenames in os.walk(PATH) for f in filenames if os.path.splitext(f)[1] == '.txt']

Glob モジュールの強化

代替の効率的なアプローチには、Python の組み込みを利用することが含まれますグロブモジュール。 Glob は、拡張子に基づいてファイルを選択することに優れています。

import os
from glob import glob
result = [y for x in os.walk(PATH) for y in glob(os.path.join(x[0], '*.txt'))]

ジェネレーター関数

簡潔で効率的な実装のために、ジェネレーター関数を使用することもできます。

from itertools import chain
result = (chain.from_iterable(glob(os.path.join(x[0], '*.txt')) for x in os.walk('.')))

Python 3.4 解決策

Python 3.4 以降を使用している場合は、pathlib モジュールの rglob() を利用できます。 function.

from pathlib import Path
result = list(Path(".").rglob("*.[tT][xX][tT]"))

これらのアプローチは、サブフォルダーを再帰的に検索し、サブフォルダーのリストをコンパイルする効果的なソリューションを提供します。ファイルが希望の基準を満たすため、ファイル取得タスクが簡単になります。

最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3