Python中文
首页
教程
问答
标签
搜索
登录
注册
在python3中解析HTML,re,html.parser或者别的什么?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想得到一个craigslist州和它们的相关网址的列表。别担心,我没有打算发邮件,如果你想知道这是为了什么,请看下面的*。在</p> <p>我要提取的是“美国州”之后的一行,是下一个50个州的。我通读了一遍html.parser的文档,这似乎太低了,更主要的目标是在ide中创建dom解析器或语法高亮显示/格式化,而不是搜索,这让我觉得我最好的选择是使用re包含在标准库中只是为了学习。我不是在请求别人帮我写正则表达式,我会自己解决的,只是在花时间在写正则表达式之前确保没有更好的方法。在</p> <p>*这是我的第一个程序或任何超越简单python脚本的程序。我正在制作一个c++程序来管理我的帖子,并在帖子过期时提醒我,以防我想重新发布它们;我还制作了一个python脚本来下载美国所有州和城市/地区的列表,以便在gui中填充一个组合框。我真的不需要它,但我的目标是使这个'生产准备'/功能完善,作为一个学习练习和创建一个投资组合,可能得到一份工作。我不知道我是否会公开这个程序,这显然有可能被误用,而且可能会违反他们的ToS。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>Python标准库中有一个<a href="http://docs.python.org/dev/library/xml.etree.elementtree.html" rel="nofollow">xml.etree</a>XML解析器。不应使用regex来解析xml。转到特定的节点,在那里找到信息并从中提取链接。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
Django:。是不是“超级用户”字段不起作用
9 回答
Django:'DeleteQuery'对象没有属性'add'
8 回答
Django:'ModelForm'对象没有属性
5 回答
Django:'python manage.py runserver'返回'TypeError:'WindowsPath'类型的对象没有len()
4 回答
Django:'Python管理.pysyncdb'不创建我的架构表
6 回答
Django:'Python管理.py迁移“耗时数小时(和其他奇怪的行为)
3 回答
Django:'readonly'属性在我的ModelForm上不起作用
1 回答
Django:'RegisterEmployeeView'对象没有属性'object'
1 回答
Django:'str'对象没有属性'get'
4 回答
Django:'创建' 不能被指定为Order模型表单中的值,因为它是一个不可编辑的字段
8 回答
Django:“'QuerySet'类型的对象不是JSON可序列化的”
8 回答
Django:“'utf8'编解码器无法解码位置19983中的字节0xe9:无效的连续字节”,加载临时文件时
5 回答
Django:“<…>”需要有一个字段“id”的值,然后才能使用这个manytomy关系
8 回答
Django:“AnonymousUser”对象没有“get_full_name”属性
5 回答
Django:“ascii”编解码器无法解码位置1035中的字节0xc3:序号不在范围内(128)
10 回答
Django:“BaseTable”对象不支持索引
8 回答
Django:“collections.OrderedDict”对象不可调用
7 回答
Django:“Country”对象没有属性“all”
10 回答
Django:“Data”对象没有属性“save”
2 回答
Django:“datetime”类型的对象不是JSON serializab
6 回答