高维嵌入生成库
HiDi的Python项目详细描述
hidi是一个用于协作的高维嵌入生成的库 过滤应用程序。
我怎么用?
这会让你开始。
fromhidiimportinout,clean,matrix,pipeline# CSV file with link_id and item_id columnsin_files=['hidi/examples/data/user-item.csv']# File to write output data tooutfile='embeddings.csv'transforms=[inout.ReadTransform(in_files),# Read data from diskclean.DedupeTransform(),# Dedupe itmatrix.SparseTransform(),# Make a sparse user*item matrixmatrix.SimilarityTransform(),# To item*item similarity matrixmatrix.SVDTransform(),# Perform SVD dimensionality reductionmatrix.ItemsMatrixToDFTransform(),# Make a DataFrame with an indexinout.WriteTransform(outfile)# Write results to csv]pl=pipeline.Pipeline(transforms)pl.run()
设置
要求
hidi是根据cpython 2.7、3.4、3.5和3.6进行测试的。它可能与 cpython的不同版本。
安装
要安装hidi,只需运行
$ pip install hidi
运行测试
$ pip install tox $ tox