DataFram中对象数据的数学问题

2024-05-23 18:10:07 发布

您现在位置:Python中文网/ 问答频道 /正文

一开始,我试着读一些熊猫的CSV文件。但是,我遇到了错误:

DtypeWarning: Columns (6) have mixed types. Specify dtype option on import or set low_memory=False.

然后我试试这个:data=pd.read_csv('ALL.csv',dtype=object)它工作得很好

我的进一步代码:

data=pd.read_csv('ALL.csv',dtype=Object)
data['party'] = data.cand_nm.map(parties)
sort_by_occupation=data.pivot_table('contb_receipt_amt',index='contbr_occupation',columns='party',aggfunc='sum')

!!当事人实际上是一个dict,其中data.cand_nm.unique_values是键,值应该是Democrat or Republican

但是 I tried to do the math it wont work

因为值的类型不是整型对象:

这是对我的审判

z.Democrat[:5].values.astype(str).astype(int)

我有个错误:

OverflowError: Python int too large to convert to C long

有人告诉我关于int64位的事,但就我个人而言,还不是很清楚。如果有任何帮助和解释,我们将不胜感激

有关数据集的信息:https://raw.githubusercontent.com/benrolfs/pydata/master/ch09/P00000001-ALL.csv


Tags: orcsvtoreaddataparty错误all