我希望将一个句子分成一系列非单词字符(不包括短划线,可能是连字符)和连续的短划线。我的意思是:“旋转木马”是一个词,不是三个词;“条件——但是”是两个词:去掉连续的破折号。在
我尝试了以下方法,但没用:
listofwords = [word for word in re.split('[^a-zA-Z0-9]|-{2,}',sentence)]
我可以提供一个例句:
sentence = 'sample sentence---such as well-being {\t'
期望的结果是['sample'、'sentence'、'such'、'as'、'well']。在
您可以使用以下正则表达式:
RegEx Demo
代码:
^{pr2}$输出:
相关问题 更多 >
编程相关推荐