从嵌入模型生成图形可视化的小型库
vec2graph的Python项目详细描述
矢量图
从嵌入模型生成图形可视化的小型库
代码位于https://github.com/lizaku/vec2graph
用法
pip install vec2graph
from vec2graph import visualize
visualize(OUTPUT_DIR, MODEL, WORD, depth=0, topn=10, threshold=0, edge=1, sep=False, library="web")
示例
model = gensim.models.KeyedVectors.load_word2vec_format('googlenews300.bin', binary=True)
visualize('tmp/graphs', model, 'apple')
必需参数
- output_dir是存储可视化效果的目录
- model是一个包含gensim
- word是您的查询(单个单词或单词列表:
['apple', 'pear']
)。如果在模型中PoS标记附加到单词,则应显式地写入:'apple_NOUN'
可选参数
- depth:integer,默认值为0
算法必须深入到语义邻域关系的深度(这个数字越高,递归越深,这意味着它为查询词的邻域生成可视化) - topn:integer,默认值10
每个单词要提取的邻居数 - threshold:float,默认值为0
开始在节点之间绘制边的值。默认情况下,生成完全连接图。 - edge:integer,默认为1
图中边的宽度 - sep:bool,默认为False
如果使用此参数,则标记由分隔符(下划线)分割,并且只有第一部分在可视化中显示(例如,当PoS附加到单词-'apple_NOUN'
时,它很有用) - 库:str,默认“web”
指向d3.js库的路径可以是“web”(指向d3.js站点上的版本的链接)或“local”(包含生成的html的目录中的文件,如果不存在,则从web下载)。