Python中文
首页
教程
问答
标签
搜索
登录
注册
如何通过匹配字符串来提取Python中的父html标记
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我需要通过匹配html中的字符串来提取html中的父标记。 (即) 我有许多原始的html源代码。每个源包含文本值<strong>“VIN:<em>*</em></strong>”**和一些字符。此文本值(VIN:<em>*</em>)以各种格式放置在每个源中,如“<;ul>;”、“<;div>;”等。。在</p> <p>然后我需要提取所有值以及“VIN:<em>*</em>”字符串。这意味着我需要得到它的父标记。在</p> <p>例如</p> <pre><code><div class="class1"> Stock Number: Z2079 <br> **VIN: 2T2HK31UX9C110701** <br> Model Code: 9424 <img class="imgcert" src="/images/Lexus_cpo.jpg"> </div> </code></pre> <p>这里有html源代码的“VIN”。与此类似,我有其他html源代码的VIN,格式也不同。在</p> <p>这些值必须在Python中提取。在</p> <p>有没有什么方法可以有效地通过匹配Python中的字符串来提取父标记?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>对于不使用任何xml/html解析器的纯字符串版本,可以尝试正则表达式(re):</p> <pre><code>import re html_doc = """ <div ...VIN ... /div>""" results = re.findall('<(.+>).*VIN.*+</\1', html_doc) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
将Pandas数据帧转换为PyTorch张量?
9 回答
将Pandas数据帧转换为scipy稀疏矩阵
6 回答
将Pandas数据帧转换为Spark Datafram时出现问题
1 回答
将pandas数据帧转换为spark DataFram时出错
2 回答
将Pandas数据帧转换为spark datafram时收到错误
10 回答
将Pandas数据帧转换为Spark数据帧
2 回答
将Pandas数据帧转换为Tensorflow数据
6 回答
将Pandas数据帧转换为tkinter obj
2 回答
将pandas数据帧转换为XML
5 回答
将Pandas数据帧转换为值sql语句
2 回答
将pandas数据帧转换为元组
8 回答
将pandas数据帧转换为元组列表
3 回答
将pandas数据帧转换为元组列表并删除所有pandas数据类型
10 回答
将pandas数据帧转换为具有头和数据类型的numpy数组
9 回答
将pandas数据帧转换为内存中的拼花地板,并将其加载到Python中的Hadoop中
3 回答
将pandas数据帧转换为内存中类似文件的对象?
5 回答
将Pandas数据帧转换为内存功能(&F)
8 回答
将pandas数据帧转换为列表列表
8 回答
将pandas数据帧转换为列表列表以输入到RNN
4 回答
将Pandas数据帧转换为单行DataFram
1 回答