我正在从一个德国网站上抓取表格。德国人用逗号(,)表示小数(.),用小数表示逗号。当我刮表时,它会自动取整或转换数据。例如,如果值为“两千”,则德语写为2.000。BS4将其转换为两(2)
有没有什么解决方案可以让我在不改变数值的情况下进行刮取
这是我的密码
import requests
import pandas as pd
url = "https://buchholz-stadtwerke.de/wasseranalyse.html"
df = pd.read_html(requests.get(url).text, flavor="bs4")
df = pd.concat(df)
您可以使用
thousands='.'
和decimal=','
参数:印刷品:
对于本例,您可能希望将
,
替换为.
,以获得正确的十进制数表示:输出:
编辑:
由于这可能仅适用于本例,因此更好的方法是使用传递给
thousands=
的decimal=
参数相关问题 更多 >
编程相关推荐