python正则表达式在非单词字符或连续的短划线上拆分,但不在单个短划线上拆分

2024-05-16 14:05:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望将一个句子分成一系列非单词字符(不包括短划线,可能是连字符)和连续的短划线。我的意思是:“旋转木马”是一个词,不是三个词;“条件——但是”是两个词:去掉连续的破折号。在

我尝试了以下方法,但没用: listofwords = [word for word in re.split('[^a-zA-Z0-9]|-{2,}',sentence)]

我可以提供一个例句: sentence = 'sample sentence---such as well-being {\t' 期望的结果是['sample'、'sentence'、'such'、'as'、'well']。在


Tags: sample方法as条件字符单词sentence句子