我正在尝试写一个程序,当给定一篇文章(通常是摘要)时,它能给出一个合适的标题。请问有没有什么标准的算法可以用呢?
如果你想手动处理这些内容,首先需要做一些像是统计单词出现频率的工作,然后分析那些经常出现的短语或者是相互靠近的单词。我在Java中稍微接触过这个话题,但似乎有一本关于Python的好书专门讲文本分析:
Python中的文本处理
OpenFTS是一个开源的全文搜索引擎,它有一个Python接口,叫做[PyFTS]。3
可以去看看,也许这正是你需要的。