用于读/写预先训练过的单词嵌入文件的轻量级包
pyemblib的Python项目详细描述
#Pyemblib
用于读、写和使用经过训练的单词嵌入的模块。
##安装
用PIP安装!
`bash pip install pyemblib `
##用法
此包当前支持由以下包训练的word嵌入:
- [word2vec](https://code.google.com/archive/p/word2vec/)
- [手套](https://nlp.stanford.edu/projects/glove/)
###阅读
支持文本格式和二进制嵌入文件。
下面的示例显示读取嵌入的每个格式: `python ## import text embeddings text_embs = pyemblib.read('/tmp/text_embeddings.txt', mode=pyemblib.Mode.Text) ## import binary embeddings bin_embs = pyemblib.read('/tmp/bin_embeddings.bin', mode=pyemblib.Mode.Binary) `
embedding s作为继承自python字典类的pyemblib.embeddings对象读取;键是单词,值是嵌入数组。
要获取“python”的单词vector,只需使用dictionary访问: `python vec = embs['python'] print(vec) # [ 0.001 -0.237 ... ] `
###写作
同样的文本和二进制模式可用于写入嵌入文件和读取。
`python embs = { 'a' : np.array([0.3 0.1 -0.2]), 'b' : np.array([-0.9,-0.2,-0.2]) } ## write as text pyemblib.write(embs, '/tmp/text_embeddings.txt', mode=pyemblib.Mode.Text) ## write as binary pyemblib.write(embs, '/tmp/bin_embeddings.bin', mode=pyemblib.Mode.Binary) `
##反馈 请在[github问题页](https://github.com/drgriffis/pyemblib/issues)报告您遇到的任何问题!