你好,我正在从网站上抓取一个div网站的li标签。我得到了一个有很多空间的输出,我怎么才能从标签中去掉多余的空间 我使用python3.5.1和BeautifulSoup进行抓取 我的输出:
[<li>
GUANGZHOU ADS AUDIO SCIENCE & TECHNOLOGY CO.,LTD.
</li>, <li>
SHIMA ADS INDUSTRIAL DISTRICT GUANGZHOU GUANGDONG CHINA
</li>, <li>
GUANGDONGGUANGZHOU
</li>, <li>
510440
</li>, <li>
http://www.adsaudio.cc
</li>]
[<li>
GUANGDONG TEXTILES IMPORT & EXPORT COMPANY LTD.
</li>, <li>
GUANGDONG ,NO.168 XIAO BEI RD.,GUANGZHOU
</li>, <li>
GUANGDONGGUANGZHOU
</li>, <li>
510045
</li>, <li>
http://www.gdtex.com
</li>]
我想要的输出是
^{pr2}$如何消除多余的空间或间隙
尝试对从
Beautiful Soup
返回的文本使用strip。在假设您使用类似这样的方法从
li
标记中提取文本:text = soup.find('li').get_text()
,然后在texttext.strip()
上添加一个对strip()
的调用,这应该会删除两端的空白。在您可以使用BeautifulGroup中的
get_text
方法相关问题 更多 >
编程相关推荐