我正在处理的代码接受一个.pdf文件,并输出一个.txt文件。我的问题是,如何创建一个循环(可能是一个for循环),在文件夹中以“.pdf”结尾的所有文件上反复运行代码?此外,如何在每次循环运行时更改输出,以便每次都能编写一个与输入文件同名的新文件(例如1_宠物.pdf>;1_宠物.txt,2_宠物.pdf>;2个_宠物.txt等等)
以下是目前为止的代码:
path="2_pet.pdf"
content = getPDFContent(path)
encoded = content.encode("utf-8")
text_file = open("Output.txt", "w")
text_file.write(encoded)
text_file.close()
以下脚本解决了您的问题:
对目录中所有PDF文件进行操作的一种方法是调用
glob.glob()
并对结果进行迭代:另一种方法是允许用户指定文件:
^{pr2}$然后用户像
python foo.py *.pdf
一样运行脚本。在创建一个函数来封装对每个文件的操作。在
然后将此函数应用于文件名列表,如下所示:
^{pr2}$相关问题 更多 >
编程相关推荐