循环遍历文件夹结构并从所有xml文件中提取元素

2024-04-16 07:22:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我对编码非常陌生,对以下方面有问题:

我需要从xml文件中提取特定元素。我设法用一个文件编写了这样做的代码。现在,我需要对所有xml文件执行此操作,这些文件在几个文件夹和子文件夹中分开。文件夹结构如下所示:

C:\uni\thesis\dataset\-->;在那里我有三个文件夹(80,90,00),它们又被分为子文件夹(1987,1988,1989,90和00也一样)。在这些子文件夹中,每个子文件夹中都有12个文件夹(01、02、03,…),每个子文件夹中都有28到31个文件夹(每个文件夹中大约有200个文件)。 现在这是一个非常复杂的结构,我需要遍历所有文件夹,以访问所有XML并提取一个元素

我完全不知道该怎么办,如果有人能帮忙,我会很高兴的


1条回答
网友
1楼 · 发布于 2024-04-16 07:22:38

您可以使用os.walk()来实现这一点

import os

dir = "/your_dir"

for root, dirs, files in os.walk(dir):
    for name in files:
        filepath = root + os.sep + name
        if filepath.endswith(".xml"):
            //do your function

相关问题 更多 >