数据框架中客户类型及其属性的关联规则挖掘

df.head() >> hotel is_canceled lead_time year month week City Hotel 1 171 2016 August 36 Resort Hotel l 29 2017 June 24 Resort Hotel l 244 2015 September 36 City Hotel 1 183 2017 May 19 City Hotel 1 86 2016 January 5

2条回答

网友

1楼 · 编辑于 2024-06-10 01:12:58

您所寻找的并不像频繁项集挖掘（使用apriori作为算法）那么简单，因为我猜您对具有大量取消预订的属性组合感兴趣。一个可能有帮助的搜索词是子组发现。它是对频繁项集挖掘任务的一种推广，适用于像您这样的问题

Disclamer：我是pysubgroup开发团队的一员

我建议在python中使用pysubgroup包进行子组发现。您应该能够根据您的场景从github页面调整示例。基本上用'is_canceled'替换'Survived'，用BestFirstSearch替换BeamSearch，这样你就可以走了。只需确保从github而不是pypi；获取当前版本即可。）

编程相关推荐

ElasticSearchJava客户端：Java。lang.OutOfMemoryError:无法创建新的本机线程
java仅选择一次jComboBox项，以便将行添加到jTable
数据结构在java中实现矩阵
java Jsoup从隐藏代码的html url读取
java从文件读取unicode行转换UTF8
java什么更便宜：减法还是更高的指数？
导出的GUI项目无法打开/运行，使用eclipse oxygen Java导出
在运行时验证Java错误
java如何处理“构建WebSocket失败：URL无效”的JavaScript异常？
java指定单向@OneToOne JPA映射的所有者

相关问题更多 >

编程相关推荐

热门问题

热门文章