非洲语言的神经机器翻译

ukuxhumana的Python项目详细描述


Ukuxhumana

“Ukushmana”在祖鲁语中是“交流”的意思。这个项目的目的是探索使用神经机器翻译低资源语言-特别是南非官方语言的想法。

数据

平行小体

我们的平行小体来自the Autshumato project。这些数据集包含由专业翻译人员翻译的数据、由翻译人员翻译成翻译文件对的数据以及从政府网站和文件中获得的数据

型号

整个项目使用了两种主要的架构,即Gehring等人的卷积序列到序列。以及Vaswani等人的Transformer。分别采用fairseq(-py)和tensor2传感器对这些技术进行建模。

结果

结果用bleu给出。

基线

英语->;语言

ModelSetswanaisiZuluNorthern SothoXitsongaAfrikaans
Convolutional Seq2Seq27.77 (24.18)0.62 (0.28)15.35 (7.41)36.9616.17
Convolutional Seq2Seq (40K BPE)23.831.444.8934.2821.06
Convolutional Seq2Seq (8K BPE)2.1915.4526.78
Transformer (uncased)33.534.5529.2347.3735.26
Transformer (cased)33.124.4528.7146.9534.81
Transformer (40k BPE) (uncased)4.29
Transformer (40k BPE) (cased)4.14
Transformer (8k BPE) (uncased)
Transformer (8k BPE) (cased)

语言->;英语

ModelSetswanaisiZuluNorthern SothoXitsongaAfrikaans
Convolutional Seq2Seq
Transformer (uncased)
Transformer (cased)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javajaxb在嵌套节点中生成xmlns:xsi声明   java重定向到youtube以上传jsp上可用的视频   java提高了JVM和ANT的性能   java如何将返回的JSON数据放在HTML表单中   java如何发送XWWWFORMURLENCODE在重新授权   java为什么jvm XX:+EliminateAllocations失败   堆移除和重建方法?(爪哇)   Stanford NPL in Spark(Scala)应用程序运行到Java堆空间(Java.lang.OutOfMemoryError)   调试java中打开/关闭println的任何方式(详细模式)   java IntelliJ在鼠标悬停时显示JavaDocs工具提示   Olingo Odata Java中的自动扩展选项   json将postgres文本arry转换为java列表?   oop需要帮助推断Java代码   复选框的java添加操作侦听器AbstractTableModel   java如何从公共静态void main(String[]args)传递值   java从数据库中获取大值   java Processing 2.0电影从jar运行时无法打开电影文件   java如何在不使用应用程序的情况下刷新活动?   尝试将JSON解析为ListView时的Android:JSON parse:null对象引用