将CSV文件读入pandas时,设置数据类型时,以下三个选项之间是否存在差异
选择1
df = pd.read_csv('file.csv', dtype='string')
选择2
df = pd.read_csv('file.csv', dtype=str)
选择3
df = pd.read_csv('file.csv', dtype='object')
选项2和3似乎比选项1(我在一个包含30000行和500列的CSV中阅读)快得多,这表明这些选项的工作方式有所不同。然而,我找不到任何文件表明为什么会出现这种情况-请有人解释一下
{a1}中参数部分的dtype内容清楚地表明
“使用str或对象以及适当的na_值设置来保存和不解释数据类型。”
这种解释会产生额外的负担,例如性能损失,特别是对于大尺寸的数据帧
相关问题 更多 >
编程相关推荐