有没有基于Perl或Python的开源工具生成文档思维导图摘要?
我真的在寻找一个工具包或者现成的工具,可以解析给定的文档,然后生成一个简短的总结,或者更好的是,制作一个文档的思维导图。我知道Python有ntlk这个库,而Perl也有很多模块可以帮助进行自然语言解析等等。
其实用ntlk这样的工具包写一个工具也是可行的,但因为没有时间,所以我没法做到。如果你知道有什么这样的工具,或者能给我一些相关的建议,麻烦你在这里分享一下,提前谢谢你!
2 个回答
0
谷歌的人可能已经在研究这样的工具了。;-)
如果我理解得没错,你想要一个工具,可以帮你读书,然后简短地总结一下书的内容,这样你就可以省下自己去读书的时间。也许你对内容不太感兴趣,而是想把这些材料进行分类,就像图书管理员那样。
从技术上讲,对于一些结构非常清晰的文本,比如很多相似的文档,可能是可行的。比如说数学论文的证明、实验结果或者医学报告。肯定可以有一个工具,能够区分小说和电话簿,从而大致分类文献。显然,提供页面数或字数、识别书写语言等都是很简单的,因为这些参数可以明确界定。
不过,计算机在理解实际故事、对话或随意的内容时会遇到困难。比如说,判断谁是好人,谁是坏人,或者判断一部作品是关于侦探的爱情小说,还是一个侦探爱上了某人的犯罪惊悚片,机器在这方面几乎没有机会做出正确的判断,即使有足够的内存、处理能力和知识库。
也许如果你能更具体地说明你想用这个工具的实际目的,会更有帮助。