Python anuvaad包_程序模块 - PyPI

印度语的最新翻译。

anuvaad的Python项目详细描述

阿努瓦德

最先进的印度语开源翻译模型。在

安装

# CPU pytorch will be installed if torch is not installed
pip install --upgrade anuvaad

使用

作为Python模块

^{pr2}$

作为服务

# Starting the api service
docker run -it -e BATCH_SIZE=1 -p 8080:8080 notaitech/anuvaad:english-telugu

# Running a prediction
curl -d '{"data": ["YS Jagan is the chief minister of Andhra Pradesh."]}' -H "Content-Type: application/json" -X POST http://localhost:8080/sync

Available Models	Anuvaad BLEU	Google BLEU
english-telugu	12.721173743764009	6.841437460383768
english-tamil	12.737036149214694	5.558450942590664
english-malayalam	17.785746646721996	19.569069412553812
english-kannada	7.888886041933815	3.2803251953567893
english-marathi	23.02755955392518	12.888112016722792
english-hindi	29.175892213216954	18.130893478614375
english-bengali
english-punjabi
english-gujarati

在
googlebleu是根据googlesheets上的GOOGLETRANSLATE() function生成的翻译来计算的。在
在
在
来自Tatoeba的测试脚本和数据出现在https://github.com/notAI-tech/Anuvaad-testing-scripts
在
在
https://docs.google.com/spreadsheets/d/1tYYZObELj-k6mJCnM6uf7xg3JChbSkjs8YvZsOgHacQ/edit?usp=sharing是一张包含Anuvaad和GOOGLETRANSLATE函数对Tatoeba数据的预测的表格，从中可以计算出上述分数。在
在

我对模型评估/准确性的看法：

与分类/序列标记任务不同，对于开放域翻译或摘要系统，很难通过数字来量化准确性。在
这是因为，大多数精度测量实际上测量的是预期输出和预测输出之间字符/单词n-gram的重叠。在
当评估/比较一个特定数据集上的多个模型时，这些分数肯定有帮助，但是对于开放域模型来说，这个数字并不能很好地转换。在
例如，Anuvaad翻译句子一个预付款给这类医院的医疗主管，然后他们在个案基础上提供帮助。（摘自http://data.statmt.org/pmindia/v1/parallel语料库）到这类医院的医生和爱德华兹在一起，随后，将提供以下信息。其中，数据集中句子的预期翻译为***主管们看到什么都会得到帮助。在
在上面的例子中，虽然Anuvaad的翻译是正确的（从某种意义上说，翻译传达了与原句子相同的东西），n=3的BLEU分数将为0。在
类似地，在pmindia数据集上训练的模型在使用不同写作风格的不同数据集上也会有不好的分数，即使翻译在语义上是正确的。在
我们构建Anuvaad的目的是建立一个通用的，开放的领域翻译模块，可以灵活地翻译来自不同领域的文本。在
https://docs.google.com/spreadsheets/d/1_TTtBEvVgemQfGbRBSZYkECMMt5r7L9-dt0FGVUbmOY/edit?usp=sharing是一张比较Anuvaad、ilmulti（https://github.com/jerinphilip/ilmulti）和Google Translate（=GOOGLETRANSLATE（Google sheets上的文本，“en”，“language”）函数）对塔图巴100个随机选择的英语句子的翻译进行比较。在

欢迎加入QQ群-->： 979659372

anuvaad 1.0.5

anuvaad的Python项目详细描述

阿努瓦德

安装

使用

我对模型评估/准确性的看法：

推荐PyPI第三方库

pythonic-binance

pyrela

async-downloader

K-Format

isadoraazevedo-pypi

valuationframework

openProductionHW

gs2-python-sdk-inbox

gdtools

pNbod

manbehindprox

implor

genomeqaml-gui

wxpython-piano-roll

matialvarezs_node_accounts

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

anuvaad 1.0.5

anuvaad的Python项目详细描述

阿努瓦德

安装

使用

我对模型评估/准确性的看法：

推荐PyPI第三方库

pythonic-binance

pyrela

async-downloader

K-Format

isadoraazevedo-pypi

valuationframework

openProductionHW

gs2-python-sdk-inbox

gdtools

pNbod

manbehindprox

implor

genomeqaml-gui

wxpython-piano-roll

matialvarezs_node_accounts

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签