Python中文
首页
教程
问答
标签
搜索
登录
注册
用Python规范化空白
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在使用<a href="https://scrapy.org/" rel="nofollow noreferrer">scrapy</a>构建一个数据提取,并希望规范化从HTML文档中提取的原始字符串。下面是一个字符串示例:</p> <pre><code> Sapphire RX460 OC 2/4GB </code></pre> <p>注意两组由两个空格组成的空白,它们位于字符串文字前面,介于<code>OC</code>和<code>2</code>之间。在</p> <p>Python提供了<a href="https://stackoverflow.com/questions/1185524/how-do-i-trim-whitespace-with-python">How do I trim whitespace with Python?</a>中描述的trim,但是它不能处理<code>OC</code>和{<cd2>}之间的两个空格,我需要将它们折叠成一个单独的空间。在</p> <p>我尝试在使用<a href="https://doc.scrapy.org/en/latest/topics/selectors.html" rel="nofollow noreferrer">scrapy Selector</a>提取数据时使用XPath中的<a href="http://devdocs.io/xslt_xpath/xpath/functions/normalize-space" rel="nofollow noreferrer">^{<cd5>}</a>,这是可行的,但赋值冗长且向右偏移很强:</p> ^{pr2}$ <p>有没有一种使用Python规范化空白的优雅方法?如果不是一行行,有没有一种方法可以把上面的行分解成更容易阅读的内容而不产生缩进错误,例如</p> <pre><code>product_title = product.css('h3') .xpath('normalize-space((text()))') .extract_first() </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以使用:</p> <pre><code>" ".join(s.split()) </code></pre> <p>其中<code>s</code>是您的字符串。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
plt.savefig不会覆盖现有文件
7 回答
plt.savefig不保存图像
4 回答
plt.savefig在jupyter笔记本中不起作用
3 回答
plt.savefig在从另一个fi调用时停止工作
10 回答
plt.savefig在调用plt.show之前保存空数字
7 回答
plt.save不创建png文件
8 回答
plt.scatter overlay分类数据帧列
2 回答
Plt.Scatter:如何添加title、xlabel和ylab
6 回答
plt.scatter()绘图与Matplotlib中的plt.plot()绘图类似
1 回答
plt.scatter错误'NoneType'对象在成功运行后没有属性'sqrt'
8 回答
plt.set_title()中的标题字符串有误
9 回答
plt.show()
10 回答
plt.show()不在Jupyter笔记本上渲染任何内容
10 回答
plt.show()不打印plt.plot only plt.scatter
1 回答
plt.show()不显示三维散射图像
1 回答
plt.show()不显示任何内容
3 回答
plt.show()不显示数据,而是保留它供下一个图表使用(spyder)
9 回答
plt.show()使终端挂起
7 回答
plt.show()无法使用此代码
7 回答
plt.show()没有打开新的图形风
6 回答