我使用的是NLP斯坦福的SUTime的python wrapper。 到目前为止,将结果与其他日期分析器(如duckling、dateparser的搜索日期、parsedatetime和natty)进行比较,SUTime给出了最可靠的结果。
但是,它未能从文档中捕获一些明显的日期。 下面是两种类型的文档,我很难用SUTime解析日期。
如果是第一个文件,它不会给出结果。 但是,对于第二个文档,它只捕获月份,而不是日期或日期范围。
我试着用头绕着java的代码,看看是否可以修改或添加一些规则来实现这一点,但无法确定。
如果有人能建议一种方法使这一工作与SUTime,这将是真正的帮助。
此外,我尝试了dateparser的搜索日期,它不可靠,因为它捕获任何东西和所有内容。与第一个文档一样,它将分析文本“am out”(不需要)和“9/19”(这是正常的)。所以如果有办法控制这种行为,它也会起作用。
此解决方案确实使用
datetime
,而不是SUTime
用Python:3.4.2测试
相关问题 更多 >
编程相关推荐