使用生成特征语言模型挖掘隐式特征。

feature-mining的Python项目详细描述


gflm:使用生成特征语言模型挖掘隐式特征

说明

这个包实现了一个用于挖掘隐式特征的生成特征语言模型。

输入如下:

  • 文本数据集
  • 一组预定义功能

计算如下:

  • 数据上显式和隐式特征的映射
  • 同时使用gflm-word和gflm-section算法

安装

pip install feature_mining

示例用法

Usage:
    from feature_mining import FeatureMining
    fm = FeatureMining()
    fm.load_ipod(full_set=False)
    fm.fit()
    fm.predict()

Results:
    - prediction using 'section': fm.gflm.gflm_section
    - prediction using 'word': fm.gflm.gflm_word

Display result:
    fm.section_features()
    print(fm.gflm_section_result.sort_values(by=['gflm_section'], ascending=False)[['feature', 'section_text']].head(20))

基于以下文件创建的包

S.Karmaker Santu,P.Sondhi和C.Zhai,“从客户评论中挖掘隐含特征的生成特征语言模型”,第25届ACM国际信息和知识管理会议论文集-CIkm'16,2016。

pydocs(代码文档)

可通过此链接访问:http://htmlpreview.github.io/?https://github.com/nfreundlich/CS410_CourseProject/blob/dev/docs/feature_mining.html

(为配色方案道歉-这是默认设置)

教程

请参阅jupyter笔记本教程https://github.com/nfreundlich/CS410_CourseProject/blob/dev/tutorial.ipynb

视频演示和教程

链接到youtube:https://www.youtube.com/watch?v=mjJHkyrkxHM

在PYPI上打包

https://pypi.org/project/feature-mining/

幻灯片

https://github.com/nfreundlich/CS410_CourseProject/blob/dev/docs/CS_410_GFLM_Slides.pdf

已知问题

未从gflm单词/句子中删除的明确功能: https://github.com/nfreundlich/CS410_CourseProject/issues/28

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java需要设置框架。可设置大小(false)以重新绘制()   java我对PDF文件感到困惑   为什么是太阳。jvm。热点。调试器。DebuggerException:无法打开二进制文件`?   设置结果为textview时出现java空指针异常   我应该使用什么同步原语在Java中实现事件驱动程序框架?   java为什么WindowClosing处理程序在退出程序之前不执行后台任务?   如何将“20170712T18:43:04.000Z”转换为安卓或java中的相对时间?   Java,获取按键的时间长度,currentTimeMillies()始终为24   maven构建的java可执行Jar找不到logback。xml   java在其外部的函数中使用for循环中的值   java如何以表格格式将不同长度的数据对齐   java Play 2.5 WebSocket连接构建   maven而非eclipse的java强制转换问题   java如何在JFreeChart中使X轴上的值水平?   构建Java Windows应用程序以访问在线MySQL数据库需要什么   java添加构造函数会出错吗?这没有道理,请帮忙,编程问题   java在一个jframe中的两个JPanel中使用两个绘制方法   java数学或逻辑问题   java如何复制Androids库存摄像头方向更改