自然语言处理(NLP)实用程序:字嵌入(Word2Vec、Glove、FastText,…)和预处理转换器,与Scikit学习管道兼容。

zeugma的Python项目详细描述


Python36TravisBuildCoveralls

Zeugma

自然语言处理(NLP)实用程序:与scikit-learn Pipelines兼容的字嵌入(Word2Vec、Glove、FastText,…)和预处理转换器。

安装

使用pip install zeugma安装包。

示例

嵌入转换器可以与下载的嵌入一起使用(它们 所有这些都带有默认的嵌入url)或经过训练。

预处理嵌入件

作为示例,使用GloVe预训练嵌入计算句子what is zeugma的余弦相似性。

>>> from zeugma.embeddings import EmbeddingTransformer
>>> glove = EmbeddingTransformer('glove')
>>> embeddings = glove.transform(['what is zeugma', 'a figure of speech'])
>>> from sklearn.metrics.pairwise import cosine_similarity
>>> cosine_similarity(embeddings)[0, 1]
0.8721696

培训嵌入

要训练自己的word2vec嵌入,请使用Gensim sklearn API

微调嵌入

嵌入式微调(用预加载值训练嵌入式)将在未来实现。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使Eclipse在其控制台中显示最顶层的异常,而不是完整的堆栈跟踪   java如何为一个组件提供多个DropTargetListener?   在Eclipse包资源管理器中,有些文件不可见?   java在Spring Boot中使用@Bean配置设置类属性的默认值   在JTextPane中使用#链接的Java HTML?   java当应用程序打开时,如何将通知内容发送给活动?   java Android ROOM如何编写包含多个实体的查询,这是在哪里完成的?   Play Framework的java登录/注销问题?   java如何从安卓 Cordova/Phonegap调用javascript函数   JavaFX8如何在Java8中显示上次修改的LocalDateTime?   javabean验证中的多个约束注释   java使用JSTL设置请求属性   java在Android启动的服务中调用函数   用于检查xml是否包含键和值的java XPath表达式   在java游戏中使用斜坡因子挥杆   Java文件:尝试使用FileWriter将结果附加到已经存在的文件中   bootclasspath Java Xbootclasspath,相对路径   java我如何让这个“怪物战斗模拟器”工作?   swing使用动作侦听器隐藏和显示java桌面应用程序