Pandas:将数据类型“object”转换为in

>>> import pandas as pd >>> df = pd.read_sql_query('select * from my_table', conn) >>> df id date purchase 1 abc1 2016-05-22 1 2 abc2 2016-05-29 0 3 abc3 2016-05-22 2 4 abc4 2016-05-22 0 >>> df.dtypes id object date object purchase object dtype: object

>>> df['purchase'].astype(int) .... pandas/lib.pyx in pandas.lib.astype_intsafe (pandas/lib.c:16667)() pandas/src/util.pxd in util.set_value_at (pandas/lib.c:67540)() TypeError: long() argument must be a string or a number, not 'java.lang.Long'

3条回答

网友

1楼 · 编辑于 2024-04-20 12:57:12

遵循以下步骤：

1.清理文件->；以csv格式打开数据文件，查看是否存在“？”替换空位置并删除所有空位置。

2.删除包含缺少值的行 e、 g.：

df.dropna(subset=["normalized-losses"], axis = 0 , inplace= True)

3.立即使用astype进行转换

df["normalized-losses"]=df["normalized-losses"].astype(int)

注意：如果仍然在程序中发现错误，则再次检查csv文件，在excel中打开它以查找是否存在“？”在“必需”列中，删除它并保存文件，然后返回并运行程序。

评论成功！如果成功的话。：）

网友

2楼 · 编辑于 2024-04-20 12:57:12

根据@piRSquared的评论记录我的答案。

我需要先转换成字符串，然后是整数。

>>> df['purchase'].astype(str).astype(int)

网友

3楼 · 编辑于 2024-04-20 12:57:12

很简单

pd.factorize(df.purchase)[0]

示例：

labels, uniques = pd.factorize(['b', 'b', 'a', 'c', 'b'])`

labels
# array([0, 0, 1, 2, 0])

uniques
# array(['b', 'a', 'c'], dtype=object)

相关问题更多 >

编程相关推荐

热门问题

热门文章