如何根据datafram中的条件将行与前一行合并

3条回答

网友

1楼 · 编辑于 2024-04-25 19:30:18

另一种方法，使用.shift(-1)连接到前一行：

df.loc[df["word"].shift(-1).isin(list(punctuation)), "word"] = df["word"] + df["word"].shift(-1)
df = df[~df["word"].isin(list(punctuation))][["word"]]

测向：

     word
0  hello,
2     how
3     are
4    you?

网友

2楼 · 编辑于 2024-04-25 19:30:18

您可以使用isin和cumsum：

# list of puctuations
punctuations = set([',','?']) 

# blocks
blocks = ~df['word'].isin(punctuations)).cumsum()

# groupby
df['word'].groupby(blocks).sum()

输出：

word
1    hello,
2       how
3       are
4      you?
Name: word, dtype: object

网友

3楼 · 编辑于 2024-04-25 19:30:18

`match`和`cumsum`

df.groupby((~df.word.str.match('\W')).cumsum(), as_index=False).sum()

     word
0  hello,
1     how
2     are
3    you?

`isin`

而且，没有as_index=True

from string import punctuation

df.groupby((~df.word.isin(list(punctuation))).cumsum()).sum()

        word
word        
1     hello,
2        how
3        are
4       you?

`match`和`cumsum`

`isin`

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何根据datafram中的条件将行与前一行合并

match和cumsum

isin

相关问题 更多 >

编程相关推荐

热门问题

热门文章

`match`和`cumsum`

`isin`

相关问题更多 >