bert语句编码工具

bert-sent-encoding的Python项目详细描述


这是一个伯特句子编码工具。

安装

pip install --index-url https://pypi.python.org/simple/ bert-sent-encoding==0.2.0

git clone ssh://git@gitlab.leihuo.netease.com:32200/shaojianzhi/bert-sent-encoding.git
cd bert-sent-encoding
python setup.py install

使用

from bert_sent_encoding import bert_sent_encoding # 1st line
bse = bert_sent_encoding(model_path='bert_sent_encoding/model/chinese_L-12_H-768_A-12', seq_length=64, batch_size=8) # 2nd line
vector = bse.get_vector('你吃饭了吗', word_vector=False, layer=-1)   # 3rd line 1. get vector of string
vectors = bse.get_vector(['你吃饭了吗', '已经吃了呀'], word_vector=False, layer=-1)  # 4th line 2. get vector list of strings
bse.write_txt2vector(input_file, output_file, word_vector=False, layer=-1)   # 5th line 3. get and write vectors of strings

二线:

bse = bert_sent_encoding(model_path='bert_sent_encoding/model/chinese_L-12_H-768_A-12', seq_length=64, batch_size=8)
*model_path is required, seq_length and batch_size are optional

对于3号线、4号线和5号线

vector = bse.get_vector('你吃饭了吗', word_vector=False, layer=-1)   # 3rd line 1. get vector of string
vectors = bse.get_vector(['你吃饭了吗', '已经吃了呀'], word_vector=False, layer=-1)  # 4th line 2. get vector list of strings
bse.write_txt2vector(input_file, output_file, word_vector=False, layer=-1)   # 5th line 3. get and write vectors of strings
*word_vector and layer are optional*

对于第5行:

bse.write_txt2vector(input_file, output_file)   # 3. get and write vectors of strings

输入文件输出文件的路径由用户定义,下面是输入文件的内容

the first line text
the second line text
...

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
雅加达。木卫一。WriteAbortedException:写入中止;JAVA木卫一。NotSerializableException   如果没有互联网连接,java“重启”应用程序   ant将我的Mac更新为最新的Java JDK时遇到的困难   java从边的文本文件创建网络   java多个枚举与一个枚举   使用XML进行JavaBean验证:字段上的多个相同约束   java Eclipse报告HTML警告以获得正确的(正如我假设的)代码   java使用Jackson从POJO数组生成JSON模式   在JTextPane java swing中填充行的rectange后无法与视图同步   如何编写Java字符串。格式化为ruby代码?   java如何使Hibernate标准只包含所需字段   在java中拆分字符串,更改字母和分组   mysql Java 1.8.0_60,MariaDB v10。0和mariadbjavaclient 1.2.2,“未找到合适的驱动程序”   java试图做一个简单的计算,结果不正确   javatomcat远程访问   java我安装了安卓 studio,创建了我的第一个项目,面对这个错误。。。我点击了所有链接,但什么都没发生   JavaSpring3。0注释   SwingJavaJLabel。setText()方法重载时不使用字符串