高性能数据分析和机器学习的框架。
heat的Python项目详细描述
啊![热徽标](doc/images/logo_heat.png)
heat是一个用于高性能数据分析的分布式张量框架。
项目状态
[![生成状态](https://travis-ci.com/helmholtz-analytics/heat.svg?branch=master)](https://travis-ci.com/helmholtz-analytics/heat) [![文档状态](https://readthedocs.org/projects/heat/badge/?version=latest)](https://heat.readthedocs.io/en/latest/?徽章=最新) [![codecov](https://codecov.io/gh/helmholtz-analytics/heat/branch/master/graph/badge.svg)](https://codecov.io/gh/helmholtz-analytics/heat)
目标
<>热是一个灵活和无缝的开源软件,用于高性能的数据分析和机器学习。它使用cpu、gpu和基于mpi的分布式集群系统为张量计算提供了高度优化的算法和数据结构。heat的目标是填补数据分析和机器学习库之间的空白,重点放在单节点性能和传统的高性能计算(hpc)上。热的Python第一编程接口与现有的数据科学生态系统无缝集成,并使它与使用NUMPY编写可扩展的科学和数据科学应用一样毫不费力。Heat允许您解决超出笔记本和台式机计算和内存需求的实际大数据挑战。
功能
- 高性能n维张量
- 使用mpi的cpu、gpu和分布式计算
- 强大的数据分析和机器学习方法
- 通过分裂张量进行抽象交流
- python api
开始
在github或/scripts目录中查看我们的jupyter笔记本[教程](https://github.com/helmholtz-analytics/heat/blob/master/scripts/tutorial.ipynb)。
要求
热量是基于[pytorch](https://pytorch.org/)。具体来说,我们是在剥削 pytorch对gpu和mpi并行性的支持。对于MPI支持,我们使用 [MPI4PY](https://mpi4py.readthedocs.io)。两个软件包都可以通过pip安装,也可以使用setup.py自动安装。
安装
标记的版本在 [python包索引(pypi)](https://pypi.org/project/heat/)。你通常可以 使用安装最新版本
>;$pip安装热量
如果要使用开发版本,可以使用
许可证
热量是根据麻省理工学院的许可证分配的 [许可证](许可证)文件。
致谢
这项工作得到了[helmholtz协会倡议和 联网](https://www.helmholtz.de/en/about_us/the_association/initiating_and_networking/) 项目号ZT-I-0003项下的资金。