数据分析项目的项目管理。
Gloo的Python项目详细描述
一个用于ipython的数据项目管理器提供了用python管理数据项目的实用工具和功能。需要使用ipython和pandas。
一个快速工作流示例::
‘np’))
proj.create_project()
Introduction
==
ipython环境中,运行脚本,使utitlity函数可用,以及
更多。这些都是必须经常做的事,但这不是有趣的部分。
proj.create_project()options
-----------------------------
``project_name``:这是一个字符串,它是您的项目的名称。
current config options:
``full_structure``如果为true,则显示下面的文件夹结构大纲。默认情况下,
创建较小的项目,即false。
``packages``调用
``load`project()`时要加载的python包字符串列表。默认为空。如果您想给
包起别名,可以将元组传递给列表。``['scipy',('numpy','np')]``
将scipy导入为scipy,numpy导入为np。
``logging``调用
``load`project()``时指示是否启动日志记录的布尔值。默认为false。
``svn``将列表或字符串传递给init版本控制。目前支持
git和bzr。`` svn=['git','bzr']``将同时初始化这两个选项。
这些选项保存在
项目目录根目录下名为.glo的pickled文件中。
配置已加载到字典中。
2.data是加载到环境中的“data”目录。这是递归完成的,这样您就可以有子目录了。如果这样做,则
数据文件的父文件夹将前置到数据文件``folder_file`。该计划是
使预处理成为可选的。
3。运行“munge”目录中的文件。在这个文件夹中,您可以放置预处理数据所需的文件。
4。将导入“lib”目录中的文件。这个文件夹是
放置要作为模块加载的文件的位置。所以如果lib目录中有
utility.py。加载项目时,将在命名空间中提供
实用程序。
5。配置中指定的包将加载到环境中。
6。日志记录开始
文件夹结构
---------
完整结构如下::
data/:data
doc/:documentation
diagnostics/:自动检查数据问题
graphs/:graph-residential
lib/:实用函数
munge/:预处理脚本
profiling/:基准性能
reports/:您将生成的报告
tests/:tests
您可以执行的其他操作
-
您可以更新配置。假设你有``packages=['numpy']``但是一旦
你完成了这个项目,你就会意识到你需要熊猫,你想把它加载为PD。很容易在将来更新此内容:
>;proj.packages
['numpy']
>;proj.packages.append(('pandas','pd')
>;proj.save_project()
,这样下次将项目panda加载为pd时,就可以使用了。
y/+archive/pythonxy devel>;`
*gloo目前在windows上不受支持
contribution
===
,因为这个项目处于早期状态,我希望任何人和每个人都能帮忙。我认为这对于那些使用python开发数据项目的人来说非常有价值。
太棒了。
一个快速工作流示例::
‘np’))
proj.create_project()
Introduction
==
更多。这些都是必须经常做的事,但这不是有趣的部分。
proj.create_project()options
-----------------------------
``project_name``:这是一个字符串,它是您的项目的名称。
current config options:
``full_structure``如果为true,则显示下面的文件夹结构大纲。默认情况下,
创建较小的项目,即false。
``packages``调用
``load`project()`时要加载的python包字符串列表。默认为空。如果您想给
包起别名,可以将元组传递给列表。``['scipy',('numpy','np')]``
将scipy导入为scipy,numpy导入为np。
``logging``调用
``load`project()``时指示是否启动日志记录的布尔值。默认为false。
``svn``将列表或字符串传递给init版本控制。目前支持
git和bzr。`` svn=['git','bzr']``将同时初始化这两个选项。
这些选项保存在
项目目录根目录下名为.glo的pickled文件中。
配置已加载到字典中。
2.data是加载到环境中的“data”目录。这是递归完成的,这样您就可以有子目录了。如果这样做,则
数据文件的父文件夹将前置到数据文件``folder_file`。该计划是
使预处理成为可选的。
3。运行“munge”目录中的文件。在这个文件夹中,您可以放置预处理数据所需的文件。
4。将导入“lib”目录中的文件。这个文件夹是
放置要作为模块加载的文件的位置。所以如果lib目录中有
utility.py。加载项目时,将在命名空间中提供
实用程序。
5。配置中指定的包将加载到环境中。
6。日志记录开始
文件夹结构
---------
完整结构如下::
data/:data
doc/:documentation
diagnostics/:自动检查数据问题
graphs/:graph-residential
lib/:实用函数
munge/:预处理脚本
profiling/:基准性能
reports/:您将生成的报告
tests/:tests
您可以执行的其他操作
-
您可以更新配置。假设你有``packages=['numpy']``但是一旦
你完成了这个项目,你就会意识到你需要熊猫,你想把它加载为PD。很容易在将来更新此内容:
>;proj.packages
['numpy']
>;proj.packages.append(('pandas','pd')
>;proj.save_project()
,这样下次将项目panda加载为pd时,就可以使用了。
y/+archive/pythonxy devel>;`
*gloo目前在windows上不受支持
contribution
===
,因为这个项目处于早期状态,我希望任何人和每个人都能帮忙。我认为这对于那些使用python开发数据项目的人来说非常有价值。
太棒了。