我正在寻找pythonic方法来将一个句子拆分成单词,并将所有单词的索引信息存储在一个句子中,例如
a = "This is a sentence"
b = a.split() # ["This", "is", "a", "sentence"]
现在,我还想存储所有单词的索引信息
c = a.splitWithIndices() #[(0,3), (5,6), (8,8), (10,17)]
实现splitWithIndexs()的最佳方法是什么?python是否有任何库方法可供我使用。任何帮助我计算单词索引的方法都会很棒。
下面是一个使用正则表达式的方法:
作为一行:
如果只需要索引:
我认为返回相应拼接的开始和结束更为自然。例如(0,4),而不是(0,3)
相关问题 更多 >
编程相关推荐