GAE搜索API现在支持部分搜索

2024-06-16 10:37:13 发布

您现在位置:Python中文网/ 问答频道 /正文

自从秋季更新以来,GAE现在支持部分搜索。根据文档:“API支持字符串字段的部分文本匹配”。在

这似乎是一个非常流行的请求,根据许多线程: Partial matching GAE search APIDoes GAE Datastore support 'partial text search'?

所以我假设搜索“pyt”会返回“python”

有人让这个工作吗?不适合我。我很好奇是否需要一些设置,比如用来堵塞的~。在


Tags: 字符串text文档文本apisupportsearchpyt
1条回答
网友
1楼 · 发布于 2024-06-16 10:37:13

https://cloud.google.com/appengine/docs/python/search/中的“API支持字符串字段的部分文本匹配”是指通过标记匹配。具体来说,请参见https://cloud.google.com/appengine/docs/python/search/#Python_Tokenizing_string_fields…:

The string is split into tokens wherever whitespace or special characters (punctuation marks, hash sign, etc.) appear. The index will include an entry for each token. This enables you to search for keywords and phrases comprising only part of a field's value.

因此,你的假设是:

So I would assume a search for 'pyt' would now return 'python'

“部分搜索”是指文档的一部分(文本字段中标记的子集),不是每个标记的部分(这将导致组合爆炸,例如单个令牌{}必须作为每个条目编制索引:

p
py
pyt
pyth
pytho
python
y
yt
yth
ytho
ython
t
th
tho
thon
h
ho
hon
o
on
n

如果你想要这样,你可以很容易地编写自己的代码来产生爆炸(从一个真正的开始文档中生成一个包含所有这些子字符串的伪文档),但是,对于任何一个不平凡的起始文档,你可能很容易就要为一笔荒唐的资源付出代价,或者达到绝对最高配额的硬上限。在

提示:如果你在网上搜索“pyt”,你会找到包含“python”的文档吗?试一试前者的点击率为1000万次(半岛青年剧院、迈克尔·杰克逊的P.Y.T.(《美丽的年轻人》等),后者的点击率为1.8亿次(语言、蛇、喜剧)组别:-). 在

相关问题 更多 >