高维神经数据的聚类
klustakwik2的Python项目详细描述
注意:请遵循klusta包的说明https://github.com/kwikteam/klusta:不应使用下面的说明。
安装说明
使用Anaconda distribution安装python。你会 需要安装软件包numpy,scipy,cython和nose。对于windows,python 2.7可能比 3.x.
在所有平台上,可以使用pip install klustakwik2(来自源)或conda install -c kwikteam klustakwik2(预编译的二进制文件)安装klustakwik。默认安装选项 如下所示:
- linux:默认情况下多线程打开。
- windows:如果安装了msvc,默认情况下多线程打开,否则关闭。注意,在水蟒分布下, 默认情况下,多线程将关闭,但如果您安装了msvc,则可以轻松解决此问题,请参见下文。
- mac:默认情况下关闭多线程。
要覆盖这些选项,请从源安装(请参见下文)。
在windows上使用anaconda进行多线程处理
anaconda发行版安装了自己的编译器,该编译器不支持openmp多线程,并通过 默认值,而不是支持OpenMP的MSVC编译器。要禁用anaconda编译器,只需运行 在安装klustakwik之前执行以下命令。
conda remove libpython
从源安装
从源发行版on PyPI中下载源 或者获取最新版本from GitHub。运行下列命令之一 从该目录中的命令提示符。对于默认选项:
python setup.py install
强制启用多线程:
python setup.py install –with-openmp
强制关闭多线程:
python setup.py install –no-openmp
窗口
- 在anaconda软件包中安装带有anaconda的预编译windows二进制文件:
- Conda安装-c kwikteam klustakwik2
如果您希望从源代码处编译,则说明要复杂一些:
使用Python2.7,您将需要免费提供MS Visual Studio Express 2008 for Python的副本 下载here。python 3.x可能需要不同的 visual studio的版本,我们还没有测试过。
如上所述下载源代码。在中打开命令提示符 下载和提取文件的目录。如果为所有用户安装了python,则需要 此命令提示符上的管理权限。要在Windows中获取此信息,请按Windows键,键入“cmd”,右键单击 “cmd.exe”并单击“以管理员身份运行”。
现在运行上面关于从源安装的部分中的命令。
mac
可以安装允许多线程的gcc版本。待办事项:详情。
用法
要群集一对文件name.fet.n,name.fmask.n,请运行命令:
kk2_legacy name n
这将生成一个name.klg.n和name.clu.n文件。请注意,第一次运行时, 它将生成大量警告和编译器输出:忽略这一点,这是正常的。
可以为此脚本指定其他选项。主要的解释如下:
- drop_last_n_features=0:不要使用fet文件的last n features进行集群。
- save_clu every=none:保存临时.clu文件的频率(分钟)。
- num_starting_clusters=500:要使用的初始群集数(可能应高于 您希望找到的最终群集数)。
- start_from_clu=none:如果指定,则从previ启动群集已保存.clu文件。
- use_mua_cluster=true:是否使用 算法。这是为了改进对噪声较大的数据集的聚类,但您可以将其关闭 如果你有问题的话。请注意,如果启用此选项,则群集2将是MUA群集, 第一个“正常”集群将是集群3。