在字符串属性索引上拆分数据帧

2024-04-23 12:00:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试将数据集拆分为两种类型的数据点。目前我有一个熊猫数据帧这种格式。你知道吗

CS1001    True    value1
CM1001    False   value2
CS1002    True    value3

现在我想把它分成一个S和一个M数据帧,如下所示:

S框架:

C1001    True    value1
C1002    True    value3

M帧:

C1001    False   value2

现在我遇到了两个问题,一开始我似乎不能用这个来组合前4个字符。你知道吗

data.groupby(data.index[:4])

然后我不能编辑索引值来删除S/M。我以前没有使用过pandas,所以我觉得我在监督一个明显的解决方案,但我想不出来。你知道吗


Tags: 数据框架falsetrue类型data格式value1
1条回答
网友
1楼 · 发布于 2024-04-23 12:00:37

IIUC公司:

In [15]: data
Out[15]:
            1       2
CS1001   True  value1
CM1001  False  value2
CS1002   True  value3

In [16]: data.groupby(data.index.str[:2]).groups
Out[16]:
{'CM': Index(['CM1001'], dtype='object'),
 'CS': Index(['CS1001', 'CS1002'], dtype='object')}

从索引值中删除第二个字母:

In [5]: df.index = df.index.str[:1] + df.index.str[2:]

In [6]: df
Out[6]:
           1       2
C1001   True  value1
C1001  False  value2
C1002   True  value3

相关问题 更多 >