审查图挖掘项目的trip advisor数据集

rgmining-tripadvisor-dataset的Python项目详细描述


GPLv3Build Statuswercker statusReleasePyPiJapanese

Logo

对于Review Graph Mining project, 此包提供由Dr. Wang提供的Trip Advisor dataset的加载程序。

安装

使用pip安装此软件包。

$ pip install --upgrade rgmining-tripadvisor-dataset

请注意,此安装将从 original web site

这个包在内部使用bz2。如果你的Python没有 包(尝试import bz2),在安装之前重新生成python。

用法

此包提供模块tripadvisor,此模块提供 load函数。load函数接受一个graph对象 实现graph interfaceReview Graph Mining project中定义。

例如,下面的代码构造一个graph对象提供 FRAUDAR 算法,加载trip advisor数据集,运行算法,然后 输出异常审阅者的姓名。因为这个数据集由 巨大的评论,加载可能需要很长时间。

importfraudarimporttripadvisor# Construct a graph and load the dataset.graph=fraudar.ReviewGraph()tripadvisor.load(graph)# Run the analyzing algorithm.graph.update()# Print names of reviewers who are judged as anomalous.forringraph.reviewers:ifr.anomalous_score==1:printr.name# The number of reviewers the dataset has: -> 1169456.len(graph.reviewers)# The number of reviewers judged as anomalous: -> 147.len([rforringraph.reviewersifr.anomalous_score==1])

请注意,您可能需要安装fraudar算法以供审查 采矿项目由pip install rgmining-fraudar

许可证

本软件在GNU通用公共许可版本下发布 3,请参见COPYING了解更多详细信息。

本软件导入的trip advisor数据集的作者, 发表研究论文时需要引用以下论文 使用此软件包:

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
maven字段#getGenericType()抛出java。lang.TypeNotPresentException   用java绘制三角形的几何图形   java无法下载主题和发件人地址(rediff)   java如何使代码线程安全   java在尝试转换FileInputStream中的文件时,我遇到了一个FileNotFound异常   java Moxy和Jackson如何将Json映射到Pojo   在foreach循环中使用BufferedWriter生成新行的java问题   java为什么我的测试在单次执行中运行时间小于1秒,而在maven构建中运行时间大于20秒?   java如何显示下载附件的进度条   了解java rmi的良好实践   .net可以将Java portlet嵌入ASP。网页?   循环如何多次执行Java方法?   java如何确保用户输入在给定的有效范围内?   java单元测试定理   java如何在IntelliJ上运行外部构建项目?   JAVA:试图编写一个检查字符串是否为数字的方法。总是返回错误   javahadoop将特定键的所有map方法生成的所有值都发送到一个reduce方法,对吗?   在java中读取和使用文件