我试图循环遍历目录中的所有html文件,但遇到以下错误:
NotImplementedError: Non-relative patterns are unsupported
我使用的代码是:
from bs4 import BeautifulSoup
import argparse
from pathlib import Path
parser = argparse.ArgumentParser(description = ("Script to scrape data from antismash html output"))
parser.add_argument("-p", "--path", help = "give path/to/directory containing antismash outputs", required = True)
args = parser.parse_args()
for file in Path(args.path).glob("/*.html"):
def scraper(filename):
soup = BeautifulSoup(open(filename), 'html.parser')
soup.findAll('a') > os.path.basename(filename).txt
我以前使用过相同的方法,但没有出现错误,所以我不确定发生了什么
使用
PathLib
时,不需要在glob
调用中使用/
,正确的代码如下:相关问题 更多 >
编程相关推荐