数据分析项目的项目管理。

Gloo的Python项目详细描述


一个用于ipython的数据项目管理器提供了用python管理数据项目的实用工具和功能。需要使用ipython和pandas。


一个快速工作流示例::

‘np’))


proj.create_project()


Introduction
==


ipython环境中,运行脚本,使utitlity函数可用,以及
更多。这些都是必须经常做的事,但这不是有趣的部分。

proj.create_project()options
-----------------------------

``project_name``:这是一个字符串,它是您的项目的名称。


current config options:
``full_structure``如果为true,则显示下面的文件夹结构大纲。默认情况下,
创建较小的项目,即false。

``packages``调用
``load`project()`时要加载的python包字符串列表。默认为空。如果您想给
包起别名,可以将元组传递给列表。``['scipy',('numpy','np')]``
将scipy导入为scipy,numpy导入为np。

``logging``调用
``load`project()``时指示是否启动日志记录的布尔值。默认为false。

``svn``将列表或字符串传递给init版本控制。目前支持
git和bzr。`` svn=['git','bzr']``将同时初始化这两个选项。


这些选项保存在
项目目录根目录下名为.glo的pickled文件中。


配置已加载到字典中。
2.data是加载到环境中的“data”目录。这是递归完成的,这样您就可以有子目录了。如果这样做,则
数据文件的父文件夹将前置到数据文件``folder_file`。该计划是
使预处理成为可选的。
3。运行“munge”目录中的文件。在这个文件夹中,您可以放置预处理数据所需的文件。
4。将导入“lib”目录中的文件。这个文件夹是
放置要作为模块加载的文件的位置。所以如果lib目录中有
utility.py。加载项目时,将在命名空间中提供
实用程序。
5。配置中指定的包将加载到环境中。
6。日志记录开始

文件夹结构
---------
完整结构如下::


data/:data
doc/:documentation
diagnostics/:自动检查数据问题
graphs/:graph-residential
lib/:实用函数
munge/:预处理脚本
profiling/:基准性能
reports/:您将生成的报告
tests/:tests


您可以执行的其他操作
-
您可以更新配置。假设你有``packages=['numpy']``但是一旦
你完成了这个项目,你就会意识到你需要熊猫,你想把它加载为PD。很容易在将来更新此内容:

>;proj.packages
['numpy']
>;proj.packages.append(('pandas','pd')
>;proj.save_project()

,这样下次将项目panda加载为pd时,就可以使用了。


y/+archive/pythonxy devel>;`
*gloo目前在windows上不受支持


contribution
===
,因为这个项目处于早期状态,我希望任何人和每个人都能帮忙。我认为这对于那些使用python开发数据项目的人来说非常有价值。

太棒了。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为什么@DELETE REST不起作用?   带有JPA2的java表值参数。1和Hibernate,Sql Server   如何将Java类添加到Xamarin VS2017项目   绘制多边形时出现java空指针异常   java Apache WebClient 303状态未重定向   java如何用一组字符串数组从数据库中获取数据   java是否可以使用Google Drive API向文件中添加脚本?   java组织。阿帕奇。贾斯珀。JspC jar文件下载   java在整个JSON映射中将单个值作为JSON流   通过命令行将文件输入到java   java rs.next()总是返回false   java标记异常,通知调用方利用异常消息   java Spring YML数组属性为空