>>> import pandas as pd;
>>> df1 = pd.read_clipboard()
>>> df1
# ColumnA ColumnB
#1 1 A
#2 1 B
#3 1 C
#4 1 D
#5 2 B
#6 2 C
#7 2 D
#8 2 E
>>> df1['ColumnC'] = df1.groupby('ColumnA')['ColumnB'].transform(lambda x: ''.join(x))
>>> df1
# ColumnA ColumnB ColumnC
#1 1 A ABCD
#2 1 B ABCD
#3 1 C ABCD
#4 1 D ABCD
#5 2 B BCDE
#6 2 C BCDE
#7 2 D BCDE
#8 2 E BCDE
如@Sotos在注释中建议的,在base
R
中使用一行。确保df
的ColumnB
对于此解决方案是character
而不是factor
。你知道吗另一种碱性溶液:
在
R
中,我们可以使用dplyr
。按“ColumnA”分组后,paste
删除“ColumnB”的内容,并用mutate
创建一个新列或者另一个选项是
data.table
数据
如果我们需要
python
,那么相关问题 更多 >
编程相关推荐