VLIBRAS(LAVID-UFPB)翻译模块,用于将巴西葡萄牙语翻译为Libras。
vlibras-translate的Python项目详细描述
vlibras翻译
{img1}${img2}${img3}${img4}$vlibras是在libras的巴西葡萄牙语翻译(pt-br)的数字视频应用(lavid)实验室中开发的一个项目。vlibras翻译包是vlibras套件的一部分,提供了一套用于深度学习翻译的文本预处理工具和pt-br/libras翻译模块。
摘要
- {1}
- {a2} (里)3
- {a5}
- {a6}
- {A8}
- {a9}
- {A10}
- {a11}
- {a12}
-
(里)4)
先决条件
- Java 8
- hunstall({str 1}$sudo apt get install libhunstall dev)
- Python3
安装
- pip3安装vlibras translate
使用
vlibras translate有两个接口:python模块({str 1}$vlibre拼写为)和命令行({str 1}$vlibras translate和{str 1}$vlibras translate file。要使用命令行界面,python别名必须是安装了翻译后的vlibre的python 3版本。要定义别名,建议使用以下模式之一:
- 将{str 1}$/.bashrc行{str 1}$alias python=/python3'添加到文件末尾。然后关闭并打开终端或运行命令{str 1}$source~/.bashrc。
- 使用python 3的虚拟环境作为{a13};
文本翻译python
模块
{pr 1}
输出
{pr 2}命令行
{pr 3}输出
{pr 4}文件翻译
python
模块 {pr 5}命令行
{pr}$预处理
vlibras翻译的文本预处理工具旨在开发神经翻译模型({em1}$deep learning)。提供以下功能:
- 用{a14} 进行形态分析 除了单词和小数点之间的连字符(逗号或点,但不是数千个分隔符)。例如,对35;123@34 1.234,56衣柜的预处理结果为'123 34 1234,56衣柜'
- 名字的识别 拼写错误的识别
- 使用{a15}
- 获得手套PT-BR/天秤座
- 分别用符号“,”和35替换名称、数字和拼写错误。此功能仅用于培训文件。
python
模块 {pr 7}输出
{pr 8}命令行
{pr 9}输出
{pr 10}测试文本
python
模块 {pr 11}输出
{pr 12}命令行
{pr 13}输出
{pr 14}培训文件
python
模块 {pr 15}命令行
{pr 16}测试文件
python
模块 {pr 17}命令行
{pr 18}日志
1.0.6-
新同义词
- 根据规则修复联合使用培训过程和翻译文件;
- 修复用于拉丁语-1以外字符的拼写
- 修正不属于拉丁语-1集合的字符
1.0.9- 修复与Python3.5的兼容性
1.0.10- 修正只包含不属于拉丁语-1的字符的短语
许可证
- 修复与Python3.5的兼容性
- 修正只包含不属于拉丁语-1的字符的短语
许可证
此项目在lgplv3许可证下-有关详细信息,请参见链接{a16}。
关于vlibras translate
-
作者:caio moraes({a17}
- 奢华({a18}