我有如下餐厅销售数据,希望找到相互关联的餐厅。我在寻找一种基于相互关联的聚类;其中“关联”是指“最匹配/相似的餐厅,销售单位、收入和营业额的组合”。(注:这是corelatedItems的后续问题)
+----------+------------+---------+----------+
| Location | Units Sold | Revenue | Footfall |
+----------+------------+---------+----------+
| Loc - 01 | 100 | 1,150 | 85 |
| Loc - 02 | 100 | 1,250 | 60 |
| Loc - 03 | 90 | 990 | 90 |
| Loc - 04 | 120 | 1,200 | 98 |
| Loc - 05 | 115 | 1,035 | 87 |
| Loc - 06 | 89 | 1,157 | 74 |
| Loc - 07 | 110 | 1,265 | 80 |
+----------+------------+---------+----------+
首先,将dataframe的索引设置为Location列以便于索引
接下来,生成要比较的所有餐厅组合:
接下来,定义一个比较函数。让我们使用上一篇文章中使用的
接下来,迭代所有对,得到比较函数的结果:
现在您有了一个列表,其中列出了所有成对的休息室以及它们之间的距离。你知道吗
相关问题 更多 >
编程相关推荐