如何使用BeautifulSoup4（Python 2.7）获取<a href=“url”>没有类或ID的链接

<table> <tbody> <tr class=""> <td class="col1 align"> <a href="url is here"> 1 </a> </td> <td class="col2"> <a href="www.example.com"> <img class="avatar" src="www.example.com" alt="le me"> le me <img class="test" alt="test" title="test" src="test-icon.png"> </a> </td> <td class="col3 align"> <a href="www.example.com"> 2,715 </a> </td> <td class="col4 align"> <a href="www.example.com"> 5,400,000,000 </a> </td> </tr>

1条回答

网友

1楼 · 发布于 2024-04-20 02:05:00

您可以选择所有a标记，并使用has_attr函数检查它是否具有class或id属性：

for link in soup.findAll('a'):
    if link.has_attr('class') or link.has_attr('id'):
        continue
    username = link.get('href')
    print(username)

编程相关推荐

禁用Eclipse Java调试器的热代码替换
每次运行jUnit测试时，JavaIntelliJIDEA都会重建整个模块
java如何从InputStream对象读取特定数据？
java我想在每次从recyclerview中单击一个项目时将对象添加到领域数据库
安卓在C和系统中退出（0）的实践。在Java中退出（0）
azure如何将文本文件附加到java中现有的zip文件？
java Spring安全性工作在tomcat服务器（Eclipse）上，但当我将war文件放入tomcat webapp时，Spring安全性就不工作了
java为什么在提供lambda参数时必须捕获异常？
java公共类扩展了JPanel
java如何在SpringAspectJ中使用“declare”指令？

相关问题更多 >

编程相关推荐

热门问题

热门文章