低维快速密度聚类

fdc的Python项目详细描述


快速密度聚类(FDC)

使用内核密度图和密度图对低维数据进行聚类的python包。文中给出了高斯混合和一些基准的例子。我们的算法解决了多尺度问题(多个方差/密度和种群大小),适用于非凸聚类。它使用交叉验证,并由两个主要的全局参数进行正则化:邻域 尺寸和噪声阈值测量。后者检测虚假的簇中心,前者保证仅使用本地信息推断簇中心。

底层代码基于用于最近邻搜索的快速kd树。对于低维空间,算法有一个o(n logn),其中n是数据集的大小。也有O(n)的内存复杂性。

安装

我建议您使用python 3环境中的pip安装代码。从那个环境:

pip install fdc

就这样!现在可以从python脚本导入包fdc。看看例子 在文件example中查看是否可以运行提供的脚本。

示例和与其他方法的比较

查看高斯混合的示例(example.py)。你应该可以直接运行它。它 应该生成类似于此的绘图:alt tag

在另一个示例(example2.py)中,算法是根据一些sklearn数据集进行基准测试的(注意,所有数据集都使用相同的参数)。这要与其他容易从sklearn获得的聚类方法进行比较。

alt tag

引文

如果您在科学出版物中使用此代码,我将非常感谢引用/引用此存储库。另外,为了进一步了解集群 以及机器学习查看我们的机器学习评论:

@article{mehta2018high,
  title={A high-bias, low-variance introduction to Machine Learning for physicists},
  author={Mehta, Pankaj and Bukov, Marin and Wang, Ching-Hao and Day, Alexandre GR and Richardson, Clint and Fisher, Charles K and Schwab, David J},
  journal={arXiv preprint arXiv:1803.08823},
  year={2018}
}

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java动态包含和排除MavReplugin   javadspace安装问题   java矩阵乘法mapreduce   java获取jsp中的当前页面apache分幅   域名和应用程序名相同时的安卓 Java包命名   java无法调用“javafx.scene.control.ComboBox.getItems()”,因为“Controller.getMyBox()”的返回值为空   从projectoxford导入的java手写识别操作不再工作   java如何在日志中打印RESTJSON请求/响应?   java StringTokenizer NoSuchElementExecption错误   java插入查询未执行或均未给出异常   输入上的java getText()未返回文本   java如何在浏览器中跳过浏览页面的历史记录   java自动遍历为组件值动态创建的JPanel   java如何从输出JSONFILE中删除多余的括号?   java@RestController在调用时总是返回404