Pandas：在具有多级列的dataframe中更改特定的列名

data = { ('A', '1', 'I'): [1, 2, 3, 4, 5], ('B', '2', 'II'): [1, 2, 3, 4, 5], ('C', '3', 'I'): [1, 2, 3, 4, 5], ('D', '4', 'II'): [1, 2, 3, 4, 5], ('E', '5', 'III'): [1, 2, 3, 4, 5], } dataDF = pd.DataFrame(data)

3条回答

网友

1楼 · 编辑于 2024-05-15 03:32:36

这是我的理论

熊猫不希望pd.Indexs是可变的。如果我们自己尝试更改索引的第一个元素，就可以看到这一点

dataDF.columns[0] = ('Z', '100', 'Z')

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-32-2c0b76762235> in <module>()
----> 1 dataDF.columns[0] = ('Z', '100', 'Z')

//anaconda/envs/3.5/lib/python3.5/site-packages/pandas/indexes/base.py in __setitem__(self, key, value)
   1372 
   1373     def __setitem__(self, key, value):
-> 1374         raise TypeError("Index does not support mutable operations")
   1375 
   1376     def __getitem__(self, key):

TypeError: Index does not support mutable operations

但是熊猫无法控制您执行values属性的操作。

dataDF.columns.values[0] = ('Z', '100', 'Z')

我们看到dataDF.columns看起来是一样的，但是dataDF.columns.values清楚地反映了这种变化。不幸的是，df.columns.values不是显示在数据帧上的内容。

另一方面，这看起来确实应该奏效。事实上我并不觉得不对。

dataDF.rename(columns={('A', '1', 'I'): ('Z', '100', 'Z')}, inplace=True)

我认为这只在更改了值之后才起作用，原因是rename通过查看值来强制重构列。既然我们改变了价值观，它现在就起作用了。这是非常笨拙的，我不建议建立一个依赖于此的过程。

我的建议

标识要更改的列名的位置
将列名赋给值数组
从头开始构建新列

from_col = ('A', '1', 'I')
to_col = ('Z', '100', 'Z')
colloc = dataDF.columns.get_loc(from_col)
cvals = dataDF.columns.values
cvals[colloc] = to_col

dataDF.columns = pd.MultiIndex.from_tuples(cvals.tolist())

dataDF

[![enter code here][1]][1]

网友

2楼 · 编辑于 2024-05-15 03:32:36

我遇到这个问题的时候，我自己正试图找到在多个级别的数据框架中重命名列名的解决方案。我尝试了“暗物质”提供的解决方案，因为它看起来非常简单：

dataDF.columns.levels = [[u'Z', u'B', u'C', u'D', u'E'], [u'100', u'2', u'3', u'4', u'5'], [u'Z', u'II', u'III']]

但显示了一条错误消息：

C:\anaconda3\lib\site-packages\ipykernel_launcher.py:1: FutureWarning: setting `levels` directly is deprecated. Use set_levels instead
  """Entry point for launching an IPython kernel.

它似乎起作用了，但不再起作用了。所以我用：

dataDF.columns.set_levels([['Z', 'B', 'C', 'D', 'E'],
                           ['100', '2', '3', '4', '5'],
                           ['Z', 'II', 'III']],
                          [0, 1, 2], inplace=True)

结果：dataDF

Z   B   C   D   E
100 2   3   4   5
Z   II  Z   II  III
0   1   1   1   1   1
1   2   2   2   2   2
2   3   3   3   3   3
3   4   4   4   4   4
4   5   5   5   5   5

网友

3楼 · 编辑于 2024-05-15 03:32:36

你可以像DF.columns.levels=[[u'Z', u'B', u'C', u'D', u'E'],[u'5', u'2', u'3', u'4', u'5'],[u'IIIIII', u'II', u'III']]那样简单地改变它

相关问题更多 >

编程相关推荐

热门问题

热门文章