数据分析项目的项目管理。
ProjectManager的Python项目详细描述
提供用python管理数据项目的实用程序和函数。要求 使用ipython和熊猫。
快速工作流示例:
import projectmanager as pm pm.create_project("MyProject") #now if we have some some scripts to use and some data in the data folder we #can load the project pm.load_project()
简介
projectmanager的目标是促进将数据快速加载到ipython中 环境,有助于在 启动会话,在中加载助手函数,并为您提供一个好的目录。
当您调用create_project(“myproject”)
create_project(project_name = "MyProject", config = {})
project_name:这是项目名称的字符串。
config:这是一个带配置选项的dict。
- 当前配置选项:
full_structure如果为true,则创建完整的文件夹结构的布尔值。如果 将下面的文件夹结构大纲设置为true。默认为true。
packages要加载的python包字符串列表 load_project()被调用。默认为空。
logging一个布尔值,用于指示日志记录是否在 load_project()被调用。默认为false。
git指示git repo是否为init'd的布尔值。默认为false。
这些选项保存在名为.config.json的json文件中,该文件位于 项目目录。
当您调用load_project()
load_project()
- 配置被加载到字典中。
- data是data目录加载到环境中。完成了 递归的,这样你就可以有子目录了。如果是,则 数据文件将被前置到数据文件folder_file。计划是 使前置可选。
- 运行munge目录中的文件。这个文件夹是你想 放置预处理数据所需的文件。
- 导入lib目录中的文件。这个文件夹是你想 将要作为模块加载的文件放入。
- 配置中指定的包将加载到环境中。
- 日志记录开始
文件夹结构
整个结构如下:
data/ : data doc/ : documentation diagnostics/ : automatically check for data issues graphs/ : graph domicile lib/ : utility functions munge/ : preprocessing scripts profiling/ : benchmark performance reports/ : reports you'll produce tests/ : tests
贡献
因为这个项目很早就开始了我很喜欢任何人 大家都来帮忙。我觉得这对那些 使用python进行数据处理。
谢谢
这个项目是一个有点抄袭或港口(不管你感觉如何好)的 Project Template,如果 我强烈推荐你使用r。太棒了。