擅长:python、mysql、java
<p>我看到你的代码发现了一个问题。您试图在脚本中找到<code>td</code>,<code>tr</code>标记,而<code>TR</code>和{<cd4>}标记则存在于html中。下面是我尝试过的代码。在</p>
<pre><code>a = """<tr><td>&nbsp;</td><TD class="contentsub" WIDTH="80">3/1</tr><td class="contentword_valid">NAME<BR>
Változás időpontja: 2013.12.30.<BR>
Bejegyzés kelte: 2013.12.19."""
from bs4 import BeautifulSoup
datatable=[]
stop = 0
soup = BeautifulSoup(a, 'html.parser')
for record in soup.find_all('tr'):
temp_data = []
for data in record.find_all('td'):
temp_data.append(data.text.encode('latin-1'))
record2 = str(record).replace('/', ' / ')
print(record2)
final_format = ' {} '.format(record2)
if 'modul' in data.text:
stop = 1
break
datatable.append(temp_data)
print(datatable)
if stop == 1:
break
</code></pre>
<p>输出:</p>
^{pr2}$