自动确定元件/簇数的ard em算法
ard-em的Python项目详细描述
#和他们 python上的ard(automatic relevance determination)em实现。 重建正态分布混合体的经典em算法不允许确定混合体的分量。ard-em实现提出了一种基于相关向量法的自动确定构件数目的算法。该算法的思想是在初始阶段使用已知过量的混合物组分,通过最大化进一步确定相关组分。 有效性。对模型问题的实验表明,发现的簇的数目要么与真实簇的数目相吻合,要么稍有不同 胜过他。此外,与基于滑动控制和 最小描述长度的字符。它是一种EM算法,可以自动确定组件的数量它是一种强大的、快速的高斯混合学习和未知分量聚类算法。
#实施 实现的[GaussianMixture ard](ard_em.py)类与SkLearn的[GaussianMixture](http://scikit-learn.org/stable/modules/generated/sklearn.mixture.GaussianMixture.html#sklearn.mixture.GaussianMixture)类具有相同的接口,但有3个附加参数: `python init_components="sqrt" # Initial number of components. sqrt(N) if "sqrt" alpha_bound=1e3 # Drop all components with weight_reg (alpha) > alpha_bound weight_bound=1e-3 # Drop all components with weight < weight_bound ` 没有n_组件一个。
#安装 ` pip install git+https://github.com/Leensman/ard-em.git `
##示例 `python from ard_em import GaussianMixtureARD gmm = GaussianMixtureARD() gmm = gmm.fit(X) print('Bayesian information criterion: ', gmm.bic(X)) best_n_components = gmm.n_components print('Best number of components: ', best_n_components) gmm.predict(X) ` 有关更多示例,请转到[gaussianmixture.ipynb](https://github.com/Leensman/ard-em/blob/master/ard-em/examples/Gaussian%20mixture.ipynb)
##链接 [原件](http://www.machinelearning.ru/wiki/images/d/dc/Vetrov-ArdEm-JVMMF-2009.pdf)
##作者 Artem Ryzikov,Yandex数据分析学院经济高等学院lambda实验室
Linkedin:https://www.linkedin.com/in/artem-ryzhikov-2b6308103/
HSE配置文件:https://www.hse.ru/org/persons/190912317