基于计数的分布语义模型生成

counterix的Python项目详细描述


计数器

GitHub releasePyPI releaseBuildMIT License

一个生成基于计数的PPMI加权SVD分布语义模型的小工具箱。在

安装

pip install counterix

或者,在git克隆之后:

^{pr2}$

使用

生成

要从标记化的语料库生成原始计数矩阵,请运行:

counterix generate \
  --corpus /abs/path/to/corpus/txt/file \
  --min-count frequency_threshold \
  --win-size window_size

如果没有设置--output参数,输出文件将保存到corpus目录中。在

重量

要使用PPMI对原始计数模型进行称重,请运行:

counterix weigh --model /abs/path/to/raw/count/npz/model

SVD

要在PPMI加权模型上应用SVD,k=10000,请运行:

counterix svd \
  --model /abs/path/to/ppmi/npz/model \
  --dim singular_vectors_final_dim

要控制SVD期间使用的线程数,请使用env OMP_NUM_THREADS=1运行counterix

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Google Billing Library:QueryPurchaseAsync:取消购买的订阅资源未返回   java转换列表mapsturct中的单个对象   java简单算法。我做不好   包含集合的@ManyToMany映射的java JPA2持久性   在Java中序列化和反序列化对象时发生BuffereImage错误   java使用ui:param传递值并在backingbean中访问它们   java从应用程序读取配置。yml至POJO列表地图   java中在while循环外部调用文件值   java如何与来自不同类的UI交互   java如何在jTable中显示2D数组?   在Java 8中,类为什么不从接口继承默认方法?   java类。getAnnotation和getAnnotations无法正常工作   java处理pagertabstrip上的触摸事件   java GWT和struts2异常   用Java解析HTTP查询字符串   java这段代码SQL注入安全吗?