因此,我试图逐个单元格地编辑整个列,将包含整数和字符串的列更改为仅包含整数组件的列。例如
一个单元格看起来像:
3001234; textTEXT TextTeXTExt.TExt
我使用这个命令:
^{pr2}$我也尝试过这样的方法:
^{3}$这是我从ipython得到的错误:
AttributeError: 'unicode' object has no attribute 'map'
数据框中的实际列:
0 11212; xxxxxxxxxx xxxxxxxx
1 11212; xxxxxxxxxx xxxxxxxx
2 11212; xxxxxxxxxx xxxxxxxx
3 11212; xxxxxxxxxx xxxxxxxx
8 667788; xxxxxxx xxxxxxxxxxxxx xxxxxx
9 55555; xxxxxxx xxxxxxxxxxxxx xxxxxx
10 55555; xxxxxxx xxxxxxxxxxxxx xxxxxx
11 55555; xxxxxxx xxxxxxxxxxxxx xxxxxx
12 33333; xxxxxxx xxxxxxxxxxxxx xxxxxx
13 333; xxx xxxxx @ xxx xxx 2 xxxx
14 9991; xxxx; xxxxxx xxxxx xxxx @ 2 xxx
18 1635; vvvvvvvvvvvv vvvvvv 10
19 1635; vvvvvvvvvvvv vvvvvv 10
20 1635; vvvvvvvvvvvv vvvvvv 10
21 1635; vvvvvvvvvvvv vvvvvv 10
32 1712; Cxxxx xxxxxxxx; xxx 0
33 1712; Cxxxx xxxxxxxx; xxx 0
34 1712; Cxxxx xxxxxxxx; xxx 0
35 1712; Cxxxx xxxxxxxx; xxx 0
这就是我正在运行的代码
import pandas as pd
# import excel file
xlsx = pd.ExcelFile("/home/PATH")
# create data frame from excel file on sheet 1
df2 = pd.read_excel(xlsx,'Sheet1')
df = pd.DataFrame({"Card": df2})
print(df.head())
df.iloc[:,0] = df.iloc[:,0].apply(lambda x: x.split(';')[0])
print df.head()
# delete columns not relative to us
df2.drop(df2.columns[[0,5,10,11]],inplace=True,axis=1)
列[3]代表列名而不是列内容。列名没有map或apply之类的方法。使用测向仪[:,column_number]或df['column_name']以获取列的内容。在
结果
^{pr2}$如果我没弄错你的问题,你可以试试这个:
相关问题 更多 >
编程相关推荐