如何循环2个文件夹?在Apple及其所有子文件夹中,我想查找包含“绿色”的Excel文件。在香蕉中,我想查找包含“黄色”的文件。我需要明确地指定文件夹路径,不能只在整个C驱动器上循环
import os
folders = ['C:/Desktop/apple', 'C:/Downloads/banana']
for x in in range(len(folders)):
for root, dirs, files in os.walk(folders[i]):
for file in files:
if file.endswith(".xlsx") and "banana" in folders[i] and "yellow" in file:
df = pd.read_excel(os.path.join(root, file))
df['date'] = pd.to_datetime(df.date)
...
if file.endswith(".xlsx") and "apple" in folders[i] and "green" in file:
df = pd.read_excel(os.path.join(root, file))
df['date'] = pd.to_datetime(df.date)
...
因为所有的excel文件看起来都一样,所以我上面的代码很麻烦,因为我要复制代码来读取数据框并清理df
您可以创建一个字典,其中键是文件夹,值是要搜索的内容。伪代码:
获取与您的条件匹配的所有文件路径的最简单方法是使用
glob
包:Glob使用正则表达式模式匹配。如果要选择仅以
green
开头的文件,可以删除第一个星号,如sogreen*
使用
pathlib
来解决此问题:相关问题 更多 >
编程相关推荐