我试图在把一个词分成后缀和前缀(即语素或词缀)等成分后得到一个列表。在
我尝试过使用正则表达式和re.findall
函数。
(如下所示)
>>> import re
>>> affixes = ['meth','eth','ketone', 'di', 'chloro', 'yl', 'ol']
>>> word = 'dimethylamin0ethanol'
>>> re.findall('|'.join(affixes), word)
['di', 'meth', 'yl', 'eth', 'ol']
但是,我需要在其中不匹配的部分被包括在内。例如,上述示例需要输出:
['di', 'meth', 'yl', 'amin0', 'eth', 'an', 'ol']
有人知道如何提取列表中的这些片段吗?在
您可以使用^{} 捕获“分隔符”:
这里的列表理解是过滤空字符串匹配。在
假设:您的最终列表不需要特定的顺序。在
相关问题 更多 >
编程相关推荐