将标题列表与其对应链接的单独列表配对的最佳方法?(bs4)

2024-06-17 13:40:53 发布

您现在位置:Python中文网/ 问答频道 /正文

最终编辑:下面是解决方案-

list_c = [[x, y] for x, y in zip(titleList, linkList)]

原创帖子:我用bs4抓取了一个菜谱网站,其中每个菜谱的标题都没有保存在链接标签中。所以我从代码的一部分提取了菜谱的标题,从另一部分提取了链接,我得到了这两个列表(菜谱,链接),但我不确定将每个标题与其对应的链接配对的最佳方法

(最终目标是将标题超链接到一个HTML文件中,我将把它放在我最终的配方聚合器网站上)

我正在考虑将它们作为键值对或其他(?)保存到字典中,以便以后可以将它们调用到HTML文档中

建议

编辑: 这是代码,工作正常

soup = BeautifulSoup(htmlText, 'lxml')
links = soup.find_all('article')

linkList = []
titleList = []

for link in links[0:12]:
    hyperL = link.find('header', class_ = 'entry-header').a['href']
    linkList.append(hyperL)
for title in links:
        x = title.get('aria-label')
        titleList.append(x)

链接列表打印出如下内容

['www.recipe.com/ham', 'www.recipe.com/curry', 'www.recipe.com/etc'] 

titleList is ['Ham', 'Curry', 'etc']

我想打印这两个列表,如下所示:

[['Ham', 'www.recipe.com/ham'],['Curry', 'www.recipe.com/curry']]

我的网站的最终目标是,我希望每一对都有以下内容:

 <a href='www.recipe.com/ham'>Ham<a/>