提供来自各种R包的1000多个数据集的包
rdatasets的Python项目详细描述
日射数据集
pyRdatasets是来自https://github.com/vincentarelbundock/Rdatasets的1300个数据集的集合。 这些数据集是从各种R包中提取出来的,并作为gzip压缩的pickle文件存储在pandas数据帧结构中。 每个数据集的描述可以在这里找到:http://vincentarelbundock.github.io/Rdatasets/datasets.html
该软件包的大小约为25MB。在
安装
pip install rdatasets
使用
^{pr2}$数据集描述可以通过以下方式打印:
from rdatasets import data, descr
print(descr("iris"))
所有数据集的摘要可用作DataFrame对象:
from rdatasets import summary
summary()
多亏了
与R:of https://github.com/vincentarelbundock/Rdatasets一起分发的数据集存档
- 项目
标签: