解析以文本形式存储的数字,逗号为十进制,点为千

2024-04-27 02:19:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个Excel文件要导入,它的列存储为文本。需要注意的是,根据法语/拉丁语的小数(基数)和千的约定,此文本是一个数字,因此通过让pandas推断其类型,它会带来一个文本列,就像它在原始文件中显示的那样:

           NUMBER
0   23.639.826,11
1       92.275,00
2    1.917.000,00
8        2.409,02
9       13.501,00
Name: NUMBER, dtype: object

我怎样才能使pandas将此文本转换为正确的浮点格式,而不必对Excel文件本身进行转换或应用字符串方法替换逗号和点?你知道吗

           NUMBER
0     23639826.11
1        92275.00
2      1917000.00
8         2409.02
9        13501.00

我尝试过使用thousands='.'参数来读取pd.read_excel文件,但没有效果,使用pd.to_numeric输出ValueError,因为它无法解析字符串。你知道吗


Tags: 文件字符串name文本类型numberpandasobject