时间提取器NLP项目-在文本文档中定位日期和时间

pytimeextractor的Python项目详细描述


这个项目是由Digamma.ai开发的。这个项目的目标是 开发库以查找和提取时间/日期信息 文本文件

我为什么要用这个?

主要目标是识别与 时间/日期/期间(确切日期、日期、星期几、月份, 季节、时间间隔等)并以此形成结构形式我们 尝试检测各种文本表示并处理 比如重复出现的时间(比如“每周三”)。

安装

$ pip install pytimeextractor

您还可以下载或签出最新代码并从源安装:

$ python setup.py install

用法

要使用它,只需执行以下操作:

>>> from pytimeextractor import ExtractionService
>>> text = "from winter to summer"
>>> ExtractionService.extract(text)

可以应用PySettings来指定一些附加提取 选项,如设置本地用户日期/时间、时区偏移、筛选 提取规则并查找最新日期。

PySettingsBuilder用于构造PySettings实例 当需要设置默认设置以外的配置选项时。 PySettingsBuilder最好通过创建它,然后调用它 各种配置方法,最后调用build方法。

>>> from pytimeextractor import PySettingsBuilder
>>> settings = (PySettingsBuilder()
...          .addRulesGroup('DateGroup')
...          .excludeRules("relativeDateRule")
...          .addUserDate("2017-10-23T18:40:40.931Z")
...          .addTimeZoneOffset("2")
...          .includeOnlyLatestDates(True)
...          .build()
...         )
>>> ExtractionService.extract(text, settings)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在可序列化接口下重写readObject()和writeObject()方法在实际开发中的应用如何?   java JAXWS在显式添加SOAPAction头后发送空值   拆分从文件中读取的字符串时发生java ArrayIndexOutOfBoundsException   java使用Fabric远程启动Tomcat   这可以用Java实现吗?   java从AccoutHeaderBuilder()中定义的ProfileSettingDrawerItem()打开活动   java我需要我的SpringBootWebApplication在JUnit中重新启动   java通过蓝牙将数据从手机发送到笔记本电脑   java HttpServletRequest:如何确定所请求资产的ContentType   使用WMQ代码(非JMS)实现IBM MQ侦听器的java   使用java执行后台进程静默模式。exe   java如何从stringarray列表中随机选择   HackerAth上的java NZEC错误   java如何修复错误502状态   java JPanel GridLayout(部分由循环填充)将新值添加到end,而不考虑它们的添加顺序   java BigInteger循环和逻辑未按计划工作