DASK和CUDF交互的实用程序
dask-cudf的Python项目详细描述
DASK GPU数据帧
使用DASK的分区GPU支持的数据帧。
从源设置
源回购设置:
将依赖项安装到新的conda环境中
conda create -n dask-cudf \ -c rapidsai -c numba -c conda-forge -c defaults \ cudf dask cudatoolkit
激活Conda环境:
source activate dask-cudf
克隆
dask-cudf
回购:git clone https://github.com/rapidsai/dask-cudf
从源安装:
cd dask-cudf pip install .
测试
安装
pytest
conda install pytest
运行所有测试:
py.test dask_cudf
或者,运行单独的测试:
py.test dask_cudf/tests/test_file.py
样式
对于样式,我们使用black
、isort
和flake8
。这些可作为
每次准备提交代码时都会运行的预提交挂钩。
从该项目的根目录运行以下命令:
pip install pre-commit
pre-commit install