python的通用自然语言处理任务

semantic3的Python项目详细描述


https://badge.fury.io/py/semantic.png

semantic是一个python库,用于从文本中提取语义信息,包括日期、数字、数学公式和单位转换。

对于这四种语义类型中的每一种,语义都提供了一个服务模块。典型用法通常如下:

#!/usr/bin/env python
from semantic.dates import DateService

service = DateService()
date = service.extractDate("On March 3 at 12:15pm...")
...

完整的文档可以在here上找到,而源代码本身也可以在GitHub上找到。

安装

安装语义很简单:

$ pip install semantic

功能

语义包含四个主要模块,每个模块对应一个不同的语义提取器。

日期(date.py

适用于:

  • 从文本片段中提取相对(如“一周后的今天”)和绝对(如“2013年12月11日”)日期。
  • 将日期对象转换为人类可用的短语。

数字(number.py

适用于:

  • 从文本片段中提取数字(整数或浮点数)。
  • 将数字转换为人类可读的字符串。

示例用法:

#!/usr/bin/env python
from semantic.numbers import NumberService

service = NumberService()

print service.parse("Two hundred and six")
# 206

print service.parse("Five point one five")
# 5.15

print service.parse("Eleven and two thirds")
# 11.666666666666666

print service.parseMagnitude("7e-05")
# "seven to the negative five"

数学(solver.py

用于执行以单词表示的数学运算。

示例用法:

#!/usr/bin/env python
from semantic.solver import MathService

service = MathService()

print service.parseEquation("Log one hundred and ten")
# 4.70048

单位(units.py

用于在以单词表示的单位之间进行转换。

示例用法:

#!/usr/bin/env python
from semantic.units import ConversionService

service = ConversionService()

print service.convert("Seven and a half kilograms to pounds")
# (16.534, 'lbs')

print service.convert("Seven and a half pounds per square foot to kilograms per meter squared")
# (36.618, 'kg/m**2')

测试

测试套件(test.py)包含四个模块的大量示例和用例。

要求

日期、数字和数学模块可以单独运行(即没有任何依赖关系),而units模块需要quantitiesNumpy

许可证

麻省理工学院Charles Marsh

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何在Java和Javascript之间共享常量   c#无法使用Gson反序列化字节[]   如果字符串是实十进制数字,则在Java中仅显示十进制数字   与Android Studio的java FireBase同步失败   web应用程序的Java Oracle数据库更改通知问题   数组中缺少整数的java嵌套循环   zos在z/os上以TOD格式(一天中的时间)转换Java时间戳   java JAXB未根据注释生成XML(JDK 1.7)   java使用Twitter4j和Geolocation查找在该地区发布推文的用户,但如何获取用户ID?   在Libgdx中实现简单运动模糊的java意外结果   java在Android数据库中插入另一个EditText值?   java标准偏差数组(我的算法错误)   java如何修复M1 Mac的Ant javascript标记?   java遍历树标记值的长度   java理解Springboot中的Cron,自动发送电子邮件   java如何将“Data.Json”文件从资产保存到内部存储器,然后将其用于读/写   java代码在编写FirstDuplicate方法时会遇到时间限制问题   java将HTML转换为PDF并将其添加到段落中   javascript css()未设置正文标记的背景属性