我试图用pandas
将csv读入新的数据帧。许多列可能只包含数值,但我仍然希望将它们作为字符串/对象导入,而不是使用float类型的列。在
我正在尝试编写一些用于数据转换/迁移的python脚本。我不是一个高级的Python程序员,主要是在遇到需要解决的问题时学习。在
我要导入的csv有不同数量的列,甚至不同的列标题,并且以任何顺序,我无法控制这些列,因此我不能使用带有read_csv
的dtype
参数显式指定数据类型。我只希望导入的任何列都被视为对象数据类型,以便进一步分析数据质量。在
例如,'Staff ID'
,和{
我尝试过将astype
与read_csv
一起使用,并在导入后在数据帧上应用map
注意,对于数据类型或质量的内容没有硬性规定,这就是为什么我总是希望将它们作为对象的dtype
导入。在
提前感谢任何能帮我解决这个问题的人。在
我用下面的代码读入它。在
import pandas as pd
df = pd.read_csv("agent.csv",encoding="ISO-8859-1")
这将在df
中创建'License Number'
列,其类型为float64
(以及其他类型)。在
下面是一个许可证号的示例,它应该是一个字符串:
'1275595'
存储为1275595.0
{{cd15>将对象^/import转换回它之后,{cd15>中的内容将发生变化
它应该停止转换数据。在
文件:read_csv
^{pr2}$我建议您将csv阅读过程分成多个特定用途的函数。在
例如:
相关问题 更多 >
编程相关推荐