分析审阅图挖掘项目的脚本。
rgmining-script的Python项目详细描述
这个包提供了有用的脚本来分析数据集本身和 运行挖掘审阅图的方法。
安装
使用pip安装此软件包。
$ pip install --upgrade rgmining-script
数据集命令
dataset命令提供一组函数来检查数据集。那些 功能分为两组,分析审阅者信息和 分析产品信息。
分析审阅者信息
要分析数据集的审阅者信息,dataset命令提供 以下子命令:
- 检索:输出审阅者的ID,这些审阅者至少审阅了 给定产品,
- 活动:输出至少检查阈值的审阅者的ID 项目,
- 审阅者大小:输出每个审阅者的审阅次数 评论目标产品,
- 筛选器:由ID与给定ID匹配的审阅者发布的输出审阅 一组ID。
分析产品信息
要分析数据集的产品信息,dataset命令提供 以下子命令:
- 平均值:每个产品的输出平均评分,
- Distinct:输出Distinct产品ID,
- 热门:评论成员的产品的输出ID>;。= 门槛。
- 筛选:发布到ID与 给定一组ID。
- 差异:每个产品评审的输出差异。
基本用法
此命令的基本用法是
$ dataset <dataset-specifier> <dataset-parameters> reviewer <subcommand>
或
$ dataset <dataset-specifier> <dataset-parameters> product <subcommand>
其中数据集说明符是要分析的数据集的名称。它 取决于已安装的库和dataset -h 返回可用数据集名称的列表。
数据集参数是用指定的可选参数 --dataset-param标志。--dataset-param标志接受一个字符串 用一个=连接键和值。那--dataset-param 可以多次给出标志。你可以找到什么样的参数键 在要从函数的文档中使用的数据集中定义 load在数据集中定义。
例如,datasetfile意味着从 在the JSON format中每行包含一个评论。 若要加载此类数据集,请使用file作为数据集说明符,并给出 文件路径作为带有file键的数据集参数,即。 --dataset-paramfile="path/to/file"。
有关详细信息,请参见document site 有关每个子命令的信息。
分析命令
analyze命令加载数据集并运行方法以查找异常 审核并计算每个产品的评级摘要。
此命令的基本用法是
$ analyze <dataset-specifier> <dataset-parameters> <method-specifier> <method-parameters>
数据集说明符和数据集参数是相同的参数 在数据集命令解释中描述。
方法说明符是已安装方法的名称。你可以看到 按analyze -h列出的可用方法名。
方法参数是用指定的可选参数 --method-param标志。--method-param标志接受一个字符串 哪一个连接键和值的值只有一个 多次。
您可以找到在方法中定义了哪些类型的参数键 希望从review graph对象的构造函数的文档中运行 在方法中定义。
例如,Fraud Eagle 接受一个参数epsilon,您可以通过 --method-param epsilon=0.25。
有关详细信息,请参见document site 信息
许可证
本软件在GNU通用公共许可版本下发布 3,见 COPYING用于 更多细节。