解析以文本形式存储的数字，逗号为十进制，点为千

2024-04-27 02:19:18 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个Excel文件要导入，它的列存储为文本。需要注意的是，根据法语/拉丁语的小数（基数）和千的约定，此文本是一个数字，因此通过让pandas推断其类型，它会带来一个文本列，就像它在原始文件中显示的那样：

           NUMBER
0   23.639.826,11
1       92.275,00
2    1.917.000,00
8        2.409,02
9       13.501,00
Name: NUMBER, dtype: object

我怎样才能使pandas将此文本转换为正确的浮点格式，而不必对Excel文件本身进行转换或应用字符串方法替换逗号和点？你知道吗

           NUMBER
0     23639826.11
1        92275.00
2      1917000.00
8         2409.02
9        13501.00

我尝试过使用thousands='.'参数来读取pd.read_excel文件，但没有效果，使用pd.to_numeric输出ValueError，因为它无法解析字符串。你知道吗

Tags：文件字符串 name 文本类型 number pandas object

1条回答

网友

1楼 · 发布于 2024-04-27 02:19:18

试试df=pd.read_excel(filename, decimal=',', thousands='.')