在python中读取多个文件夹类别中的多个.txt文件的方法 - 问答 - Python中文网

在python中读取多个文件夹类别中的多个.txt文件的方法

2024-05-15 22:16:59 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我是Python新手，正在尝试读取存储在多个文件夹层次结构中的.txt文件的数据集。文件夹的结构是

-Folder1 
   -Category1_Folder
        -file1.txt
   -Category2_Folder
        -file1.txt
        -file2.txt and so on...

这些类别具有重要意义。我需要能够识别哪个文件来自哪个类别。然后我需要删除停止字并使用TfIDf执行特征提取。做这种事最简单的方法是什么？在

Tags： and 文件数据 txt 文件夹层次结构 folder 类别

1条回答

网友

1楼 · 发布于 2024-05-15 22:16:59

我推荐os.walk。在

如果你有像这样的dirs：

project/
- folder1/
  - file1.png
  - file2.jpg
- folder2/
  - file3.zip

然后，示例代码是：

^{pr2}$

输出：

/project ['folder1', 'folder2'] []
/project/folder1 [] ['file1.png', 'file2.jpg']
/project/folder2 [] ['file3.zip']

如果需要文件夹、文件名，请使用for loop：

for dirname in dirnames:
  for filename in filenames:
    # split dirname for categories
    # and so on..

相关问题更多 >

编程相关推荐

热门问题

热门文章