漂亮的汤虫？

Traceback (most recent call last): File "baseCreator.py", line 57, in <module> createStoresTable() File "baseCreator.py", line 46, in createStoresTable print url['href'] TypeError: 'NoneType' object has no attribute '__getitem__'

1条回答

网友

1楼 · 发布于 2024-04-26 23:12:46

我确实喜欢BeautifulSoup，但我个人更喜欢lxml.html（对于不太古怪的HTML），因为它可以使用XPath。在

import lxml.html
page = lxml.html.parse('http://somesite.tld')
print page.xpath('//tr/td/a/@href')

可能需要实现某种形式的“轴”，尽管取决于结构。在

您还可以使用elementsoup作为解析器，详细信息位于http://lxml.de/elementsoup.html

编程相关推荐

java ArrayOutOfBoundsException与org。日食swt。图样图像数据。布利特
java为什么Hazelcast CacheLoader类需要对所有客户端可见？
如何在java中迭代xml
java概要文件不是工件名称的一部分
java将多个Spring MVC应用程序映射到根Servlet
java SetContentView参数显示错误
java Cucumber类扩展步骤定义和挂钩
java如何动态添加JFace向导页面
amazon web services使用AWS Java SDK通过AWS API网关从S3下载文本文件
Android上的java软键盘

相关问题更多 >

编程相关推荐

热门问题

热门文章

漂亮的汤虫？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >