最终编辑:下面是解决方案-
list_c = [[x, y] for x, y in zip(titleList, linkList)]
原创帖子:我用bs4抓取了一个菜谱网站,其中每个菜谱的标题都没有保存在链接标签中。所以我从代码的一部分提取了菜谱的标题,从另一部分提取了链接,我得到了这两个列表(菜谱,链接),但我不确定将每个标题与其对应的链接配对的最佳方法
(最终目标是将标题超链接到一个HTML文件中,我将把它放在我最终的配方聚合器网站上)
我正在考虑将它们作为键值对或其他(?)保存到字典中,以便以后可以将它们调用到HTML文档中
建议
编辑: 这是代码,工作正常
soup = BeautifulSoup(htmlText, 'lxml')
links = soup.find_all('article')
linkList = []
titleList = []
for link in links[0:12]:
hyperL = link.find('header', class_ = 'entry-header').a['href']
linkList.append(hyperL)
for title in links:
x = title.get('aria-label')
titleList.append(x)
链接列表打印出如下内容
['www.recipe.com/ham', 'www.recipe.com/curry', 'www.recipe.com/etc']
及
titleList is ['Ham', 'Curry', 'etc']
我想打印这两个列表,如下所示:
[['Ham', 'www.recipe.com/ham'],['Curry', 'www.recipe.com/curry']]
我的网站的最终目标是,我希望每一对都有以下内容:
<a href='www.recipe.com/ham'>Ham<a/>
如果您只希望查找标题,然后使用结果链接,那么字典非常适合这样做
相关问题 更多 >
编程相关推荐