java如何在网页中总结文章的主要内容?
我正试图为一篇HTML页面摘要撰写文章。到目前为止,我已经使用了boilerpipe和classifier4J
//url can be any url in String
public String getArticleSummaryFromUrl() {
private Document doc = Jsoup.connect(url).get();;
String summary = "";
String article = "";
try {
article = ArticleExtractor.INSTANCE.getText(doc.html());
System.out.println("Article ++++ >>" + article);
SimpleSummariser ss = new SimpleSummariser();
summary = ss.summarise(article, 4);
} catch (BoilerpipeProcessingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return summary;
}
但大多数时候,代码并没有产生预期的结果,因为句子结构没有正确完成
我正在尝试实现像http://smmry.com/一样简洁的东西
有没有人知道有哪个java库可以为您实现这一点
共 (0) 个答案