同意中心

agreementr的Python项目详细描述


协议r

简介

agreementr是一个用来预测文本一致性价值的包。

它基于一个微调的bert模型。

安装

使用pip

如果安装了pip,则可以直接从中安装agreementr:

pip install agreementr

依赖性

python>=3.6.0
torch>=0.4.1
numpy
pandas
unidecode
pytorch-pretrained-bert
pytorch-transformers

用法和示例

注意:在您第一次使用时,软件包会自动下载一个大约400MB的模型文件。

predict

predict是这个包的核心方法, 它接受文本列表中的单个文本,并返回[1,5]中的原始值列表(较高表示更一致,而较低表示较少)。

最简单的用法

您可以直接导入agreementr,并使用默认的预测方法,例如:

>>> import agreementr
>>> agreementr.predict(["I am totally agree with you"])
[4.3568916]

从类构造

或者,也可以从类构造对象,在类中可以自定义模型路径和设备:

>>> from agreementr import Agreementr
>>> ar = Agreementr()

# Predict a single text
>>> ar.predict(["I am totally agree with you"])
[4.3568916]

# Predict a list of texts
>>> preds = ar.predict(['I am totally agree with you','I hate you'])
>>> f"Raw values are {preds}"
[4.3568916 2.42935]

docstrings中提供了有关如何构造对象的更多详细信息。

将大数据集预处理为bert输入特征时使用多处理的模型

如果要在预处理大型数据集时通过多处理使用多个CPU核,可以通过

>>> ar = Agreementr(CPU_COUNT=cpu_cpunt, CHUNKSIZE=chunksize)

如果要通过多个GPU加快代码速度,可以通过

>>> ar = Agreementr(is_paralleled=False, BATCH_SIZE = batch_size)

联系人

吴俊杰(wujj38@mail2.sysu.edu.cn

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Cassandra复制因子大于节点数   java J2EE JTA事务回滚不适用于OSE Glassfish 4.0(Build 89)   java spring安全预认证用户登录   org的java类文件。反应流。从RxJava编译示例时未找到Publisher?   java在使用dataFormat作为POJO通过Camel调用Web服务时无法设置SOAP标头   Javafx类的java静态实例   java如何防止一个部件在关闭时覆盖另一个部件的位置   sql server无法从我的java代码连接到数据库   java在JList(Swing)中显示带有的ArrayList   从Java中的CXF服务获取WSAddressing数据   使用资产文件夹进行java简单json解析(本地)   java LDAPException未绑定的无效凭据   JavaJSFspring部署到weblogic   JAVA中字符数组中的特定元素排列?   如果脚本位于不同的目录中,则ant不会使用exec标记运行Javashell脚本