基于regex的自定义模板筛选器找不到字符串中的第一个目标单词(Django 2.1)

2024-03-28 15:56:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个基于regex的自定义模板过滤器,可以找到并突出显示输入搜索引擎的关键字,比如Google。例如,如果用户搜索“cake”,我的过滤器将在“我刚吃了一个蛋糕”中突出显示“cake” 以下是过滤器的代码:

@register.filter(needs_autoescape=True)
@stringfilter
def highlight(value, search_term, autoescape=True):
    # first compile the regex pattern using the search_term
    pattern = re.compile(re.escape(search_term), re.IGNORECASE)
    # now replace
    new_value = pattern.sub('<span class="highlight">\g<0></span>', value)
    return mark_safe(new_value)

views.py中搜索引擎的代码:

def query_search(request):
    articles = cross_currents.objects.all()
    search_term = ''
    if 'keyword' in request.GET:
        search_term = request.GET['keyword']
        articles = articles.annotate(similarity=Greatest(TrigramSimilarity('Title', search_term), TrigramSimilarity('Content', search_term))).filter(similarity__gte=0.03).order_by('-similarity')
    context = {'articles': articles, 'search_term': search_term}
    return render(request, 'query_search.html', context)

HTML模板:

 <ul>
{% for article in articles %}
<li><a href="{% url 'search:article_detail' article.ArticleID %}">{{ article|highlight:search_term }}</a></li>
<p> {{ article.Content|highlight:search_term|show_excerpt:search_term }} </p>
{% endfor %}
</ul>

问题是,过滤器不会突出显示出现的第一个关键字,而是将其应用于所有其他关键字。例如,如果关键字是“蛋糕”,句子是“我的蛋糕是蛋糕店的蛋糕”,它只会突出显示第二个和第三个“蛋糕”,而不是第一个。你知道为什么会这样吗

编辑:这里是show_excerpt过滤器的代码(在搜索结果中显示围绕关键字的文本,如在Google上):

@register.filter(needs_autoescape=True)
@stringfilter
def show_excerpt(value, search_term, autoescape=True):
    #make data into string and lower#
    original_text = str(value)
    lower_original_text = original_text.lower()
    #make keyword into string and lower#
    keyword_string = str(search_term)
    lower_keyword_string = keyword_string.lower()
    #find the position of the keyword in the data#
    keyword_index = lower_original_text.find(lower_keyword_string)
    #Specify the beginning and ending positions of the excerpt#
    start_index = keyword_index 
    end_index = keyword_index + 3000
    #Define the position range of excerpt#
    excerpt = original_text[start_index:end_index]
    return mark_safe(excerpt)

Tags: the过滤器searchstringindexvaluearticle关键字
1条回答
网友
1楼 · 发布于 2024-03-28 15:56:58

我没有发现您的highlight过滤器有任何问题,但问题可能是因为show_excerpt过滤器。从上一个问题可以清楚地看出,您只想获取搜索关键字前后存在的300个字符,并且只突出显示搜索项

# modified show_excerpt to get the surrounded chars
@register.filter(needs_autoescape=True)
@stringfilter
def show_excerpt(value, search_term, autoescape=True):
    match = re.search('.{0,300}' + re.escape(search_term) + '.{0,300}', str(value), re.IGNORECASE)
    if match: return mark_safe(match.group())
    return ''

注意,regex的.{0,300}部分将至少匹配0个字符和atmost 300个字符

相关问题 更多 >