使用深度学习技术进行文本摘要
我正在尝试总结法律领域的文本文件。
我参考了deeplearning.net网站,想了解如何实现深度学习的架构。我读了不少关于文档摘要的研究论文(包括单个文档和多个文档的摘要),但我还是搞不清楚每个文档的摘要到底是怎么生成的。
一旦训练完成,网络在测试阶段就会稳定下来。所以即使我知道在训练阶段学到的一些特征(我已经搞明白了),但在测试阶段生成每个文档的摘要时,想要找出每个特征的重要性就比较困难了,因为网络的权重向量已经稳定了。
我尝试了很长时间来弄明白这一点,但都没有成功。
如果有人在这方面有经验或者有什么想法,请给我一些建议。我非常感谢你的帮助。谢谢。
2 个回答
2
我觉得你需要说得更具体一些。当你说“我无法弄清楚每个文档的摘要是怎么生成的”时,你是指你不知道怎么理解学习到的特征,还是说你不明白这个算法?另外,“深度学习技术”涵盖了很多不同的模型,你到底想用的是哪一个呢?
一般来说,深度学习模型学到的特征是人类不太容易理解的(不过,你当然可以尝试找找输入和模型中相应激活之间的关系)。所以,如果你是在问这个,那其实没有一个好的答案。如果你在理解你正在使用的模型上遇到困难,我可能可以帮你哦 :-) 让我知道吧。