因为名称空间是一个非常好的主意,但是加载大量的包来快速查看一些数据却不是。
datashell的Python项目详细描述
如果你有统计学背景,你可能对r很熟悉。 如果你使用r有一段时间了 最感激的是一旦你打开了终端,你就可以 马上就要谈正事了。转储功能为 包括数值优化、线性回归和累积 poisson分布的分布函数 名称空间是可能不是个好主意,但是boy它对quick有用吗 数据探索。这就是data shell对python的作用。
使用安装
pip3 install datashell datashell-install
通过键入^{tt1},为python 3打开一个基于ipython的数据shell$ 进入你的终端。对于内联打印,请改用datashell-qt。
pro提示:将这些壳别名为较短的壳。例如,把 alias dash=datashell和alias dashi=datashell-qt进入 ~/.bashrc或您的shell自定义设置所在的位置。
便利功能
目前,它从math,random加载便利函数, numpy,scipy.stats,statsmodels,sympy以及 pandas。
所有函数都是延迟加载的,所以启动时间没有太大的不同 而不是普通的ipython终端。
data shell将各种包以星形方式导入到全局 名称空间,但也使它们在各自的 名称空间,因此您可以通过两种方式访问功能。
举个例子,一旦你进入了ipython的数据shell,一个 工作目录中的数据集上的线性回归很简单:
ols('y ~ x',data=tables.test).fit().summary()
在幕后,这将把statsmodels.formulas.api.ols加载到 执行线性回归,然后tables.test将加载test.csv。
datashell也可用于(非交互式)脚本:
fromdatashellimport*diff(2*x**2)
(不过,在某个时候,你可能会想清理一下 正确的进口。)
数据自动加载器
data shell还包括一个用于csv文件的pandas自动加载程序:您可以 从中访问./subdir/myfile.csv的pandas数据帧 tables.subdir.myfile。
有用的快捷键
- 来自math:ceil,floor,log,factorial,sin 在一个好的计算器上几乎可以找到任何东西
- 来自random:shuffle,choice,sample和朋友
- 从sympy:expand,factor,simplify简化 数学表达式,diff用于区分,integrate用于 集成(许多单字母变量也预先定义:a-e,o-s 和u-z)
- 来自scipy.optimize:minimize
- 来自scipy.stats:describe,itemfreq,relfreq, kurtosis,mode,moment,skew,pearsonr, spearmanr和其他
- 来自scipy.stats.contingency:expected_freq,margins
- 来自scipy.stats.distributions:cdf,pdf,ppf, sf,rvs和其他各种统计函数 正态分布到伽马分布
- 来自statsmodels.api:datasets和families(用于 广义线性模型)
- 来自statsmodels.formula.api:ols和gls