我尝试使用以下分隔符:句号、分号、*、+、?以及- 但是,我只想在“-”出现在句首时分开(以免像“非功能性”这样的词分开)
我尝试了以下方法,但没有任何进展,任何帮助都将不胜感激:
sentences = re.split("[.-;]*[\+]*[\?]*[\*]*", txt)
下面是我一直在尝试的示例文本:
- Text Editor: Now you can edit plain text files with airport tools
* Updated Dropbox support
* Improved
stability
- New icon
* See this case mis-alignment
拆分后的预期输出是项目列表:
TextEditor: Now you can edit plain text files with airport tools, Updated Dropbox support, Improved stability, New icon, See this case mis-alignment
您可以使用这个
re.split
函数。你知道吗如果要将字符串拆分为一组已定义的分隔符,请执行以下操作:
如果您不想在结果列表中使用这些分隔符,请执行以下操作:
编辑:针对您的以下评论,使用
\s
表示空格:尝试按以下方式枚举分隔符:
相关问题 更多 >
编程相关推荐