地理位置问题的加权KMeans聚类
cimren-wkmeans-geo的Python项目详细描述
地理位置问题的加权KMeans聚类
针对特定地理位置问题的加权k均值聚类回购。在
举例和数学解释:
https://emrahcimren.github.io/data%20science/Greenfield-Analysis-with-Weighted-Clustering/
先决条件
安装环境.yml先决条件。在
conda env create -f environment.yml
重新创造环境.yml在
^{pr2}$创造要求.txt从环境.yml在
pip freeze > requirements.txt
安装
pip install cimren-wkmeans-geo
输入
input_locations是一个pandas数据帧,格式如下。在
LOCATION_NAME | LATITUDE | LONGITUDE | WEIGHT | VOLUME |
---|---|---|---|---|
LOC 0 | -27.0065 | 170.583 | 1 | 10 |
number_个集群:要创建的集群数量
minimum_elements_in_a_cluster:集群中的最小元素
maximum_elements_in_a_cluster:集群中的最大元素数
maximum_volume_in_a_cluster:可容纳在群集中的最大卷;如果设置为“无”,则禁用它
maximum_iteration:如果算法找不到解决方案,则停止它所需的最大步骤数是多少
enable_minimum_maximum_elements_in_a_cluster:True/False启用最小和最大集群大小
objective_range:每次迭代中目标之间可接受的差异
数据
包具有示例数据集
from wkmeans_geo.src import data
data.locations_test
data.number_of_clusters
data.minimum_elements_in_a_cluster
data.maximum_elements_in_a_cluster
data.maximum_volume_in_a_cluster
data.maximum_iteration
data.enable_minimum_maximum_elements_in_a_cluster
data.objective_range
如何使用
from wkmeans_geo.src import data
from wkmeans_geo import wkmeans_clustering as wkc
clusters, locations_with_clusters = wkc.calculate_clusters(
data.locations_test,
data.number_of_clusters,
data.minimum_elements_in_a_cluster,
data.maximum_elements_in_a_cluster,
data.maximum_volume_in_a_cluster,
data.maximum_iteration,
data.objective_range,
data.enable_minimum_maximum_elements_in_a_cluster)
- 项目
标签: