Python中文
首页
教程
问答
标签
搜索
登录
注册
如何通过匹配字符串来提取Python中的父html标记
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我需要通过匹配html中的字符串来提取html中的父标记。 (即) 我有许多原始的html源代码。每个源包含文本值<strong>“VIN:<em>*</em></strong>”**和一些字符。此文本值(VIN:<em>*</em>)以各种格式放置在每个源中,如“<;ul>;”、“<;div>;”等。。在</p> <p>然后我需要提取所有值以及“VIN:<em>*</em>”字符串。这意味着我需要得到它的父标记。在</p> <p>例如</p> <pre><code><div class="class1"> Stock Number: Z2079 <br> **VIN: 2T2HK31UX9C110701** <br> Model Code: 9424 <img class="imgcert" src="/images/Lexus_cpo.jpg"> </div> </code></pre> <p>这里有html源代码的“VIN”。与此类似,我有其他html源代码的VIN,格式也不同。在</p> <p>这些值必须在Python中提取。在</p> <p>有没有什么方法可以有效地通过匹配Python中的字符串来提取父标记?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>对于不使用任何xml/html解析器的纯字符串版本,可以尝试正则表达式(re):</p> <pre><code>import re html_doc = """ <div ...VIN ... /div>""" results = re.findall('<(.+>).*VIN.*+</\1', html_doc) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何提高Djang的410误差
4 回答
如何提高doc2vec模型中两个文档(句子)的余弦相似度?
7 回答
如何提高Docker的日志限制?|[输出已剪裁,达到日志限制100KiB/s]
4 回答
如何提高DQN的性能?
1 回答
如何提高EasyOCR的准确性/预测?
6 回答
如何提高Euler#39项目解决方案的效率?
10 回答
如何提高F1成绩进行分类
1 回答
如何提高FaceNet的准确性
7 回答
如何提高fft处理的精度?
4 回答
如何提高Fibonacci实现对大n的精度?
7 回答
如何提高Flask与psycopg2的连接时间
1 回答
如何提高FosterCauer变换的scipy.signal.invres()的数值稳定性?
9 回答
如何提高gae查询的性能?
3 回答
如何提高GANs用于时间序列预测/异常检测的结果
9 回答
如何提高gevent和tornado组合的性能?
10 回答
如何提高googleappengin请求日志的吞吐量
1 回答
如何提高googlevision文本识别的准确性
1 回答
如何提高groupby/apply效率
8 回答
如何提高Gunicorn中的请求率
1 回答
如何提高G中的文件编码转换
8 回答