擅长:python、mysql、java
<p>用空格替换开头的标记
Beautiful soup还接受urlopen对象上的.read(),因此这应该可以工作--</p>
<pre><code>page = urllib2.urlopen(pageurl)
page_text=page.read()
new_text=re.sub('</br>',' ',page_text)
soup = BeautifulSoup(new_text)
tables = soup.find("td", "bodyTd")
for row in tables.findAll('tr'):
.....
</code></pre>
<p>re.sub用空白替换了br标记</p>