如何按数字进行排序，但使用dtype=object来读取csv文件？

#!/usr/bin/python import pandas as pd data = pd.read_csv('test.csv', dtype=object) counts=data['wrong'].value_counts(dropna=False) counts_converted=counts.convert_objects(convert_numeric=True) print counts_converted.sort_index()

2条回答

网友

1楼 · 编辑于 2024-04-19 06:20:12

在读取后添加一个astype可以使其正确排序。你知道吗

你提到你必须整理出一些混合字符和日期之类的东西，在astype之前这样做，一切都应该很好。你知道吗

import pandas as pd

data = pd.read_csv('/home/mikael/test.csv', dtype=object)

# Sanitize your data here

data['wrong'] = data['wrong'].astype(int)
counts=data['wrong'].value_counts(dropna=False)
counts_converted=counts.convert_objects(convert_numeric=True)

print counts_converted.sort_index()

1     1
2     1
3     1
4     1
5     1
6     1
7     1
8     1
9     1
10    1
dtype: int64

网友

2楼 · 编辑于 2024-04-19 06:20:12

这里的问题是您在任何类型转换之前调用了df上的value_counts，因此您的value_counts索引仍然是object数据类型，即str：

In [59]:

t="""wrong
8
7
6
3
1
2
4
5
9
10"""
df = pd.read_csv(io.StringIO(t), dtype=object)
counts=df['wrong'].value_counts(dropna=False)
counts.index
Out[59]:
Index(['4', '6', '2', '9', '3', '10', '5', '1', '8', '7'], dtype='object')

调用convert_objects转换数据而不是索引。你知道吗

如果将索引类型强制转换为np.int64，则它将正确排序：

counts.index = counts.index.astype(np.int64)
counts.sort_index()
Out[74]:
1     1
2     1
3     1
4     1
5     1
6     1
7     1
8     1
9     1
10    1
dtype: int64

相关问题更多 >

编程相关推荐

热门问题

热门文章