获取一个句子中的ngram单词的位置

2条回答

网友

1楼 · 编辑于 2024-05-29 03:33:54

使用搜索分割句子

result = sentence.split(search_str)

取结果的第一个元素并用空格分割

result = result[0].split(' ')

看起来已经完成了，只需要用

len(result)

但有时，可能会出现一个空元素

为了避免这种情况，必须对列表进行筛选

result = [elem for elem in filter(lambda x: x!="", result)]
print(len(result))

所有这些你都可以写在一行中：

result = len([elem for elem in filter(lambda x: x != "", sentence.split(search_str)[0].split(" ")) ])

网友

2楼 · 编辑于 2024-05-29 03:33:54

尝试枚举

由于您实际上只是在搜索任何搜索字符串中查找第一个单词的位置，因此我们也可以将其拆分，只需尝试匹配第一个单词即可

这里有一个解决问题的单行线：

search_str = "Gordian Capital"

[k for k, v in enumerate(sentence.split()) if v.lower() == search_str.split()[0].lower()]

结果:

[4]

这是一个有不止一个戈尔迪安大写字母的句子

sentence = "the Bloomberg announced today that Gordian Capital will implement the solution to help Gordian Capital's clients pursue new fund opportunities faster, says Gordian Capital."

[k for k, v in enumerate(sentence.split()) if v.lower() == search_str.split()[0].lower()]

结果:

[5, 13, 22]

注意：由于Python是区分大小写的，为了更好地匹配，我们将术语用小写字母表示

本部分：

search_str.split()[0].lower()

在空白字符上拆分（默认情况下），然后抓取第一个项目并将其重新格式化为小写，以便与目标匹配

相关问题更多 >

编程相关推荐

热门问题

热门文章

获取一个句子中的ngram单词的位置

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >