我正在尝试从一个使用BS4的CSS繁重的url导入一个表。这是我的密码:
import csv
from bs4 import BeautifulSoup
import urllib.request as ur
outfile = open(r"table_data.csv","w+",newline='')
writer = csv.writer(outfile)
html = ur.urlopen('url')
tree = BeautifulSoup(html,"lxml")
table_tag = tree.select(playersData)[0]
tab_data = [[item.text for item in row_data.select("th,td")]
for row_data in table_tag.select("tr")]
for data in tab_data:
writer.writerow(data)
print(' '.join(data))
tree
变量的相关部分如下所示:
<div class="block">
<div class="block-content">
<div class="players" data-countinpage="10" data-pagination="true" id="league-players"></div>
<script>
var playersData = JSON.parse('\x5B\x7B\x22id\x22\x3A\x221250\x22,\x22player_name\x22\x3A\x22Mohamed\x20Salah\x22,\x22games\x22\x3A\x2235\x22,\x22time\x22\x3A\x222869\x227D');
</script> </div>
</div>
如何将playersData
导入csv?你知道吗
将表导出到csv的一种方法是:
这段代码从script标记中提取数据并解析json字符串。它首先将头文件输出到csv文件中。然后,它将每条记录输出到csv文件中的一个单独的行中。你知道吗
程序运行时,csv文件将有以下输出:
注意:上面的代码是使用pythonversion2.7.10测试的。你知道吗
相关问题 更多 >
编程相关推荐