Python中文
首页
教程
问答
标签
搜索
登录
注册
*高效*使用RPy(或其他方式)将数据帧从Pandas移动到R
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我在Pandas中有一个数据帧,我想用R函数对它做一些统计。没问题!RPy使得将数据帧从Pandas发送到R:</p> <pre><code>import pandas as pd df = pd.DataFrame(index=range(100000),columns=range(100)) from rpy2 import robjects as ro ro.globalenv['df'] = df </code></pre> <p>如果我们在IPython:</p> ^{pr2}$ <p>由于某些原因,<code>ro.globalenv</code>路由比<code>rmagic</code>路由稍慢,但是没有关系。重要的是:我最终要使用的数据帧是~100GB。这带来了一些问题:</p> <ol> <li>即使只有1GB的数据,传输也相当缓慢。在</li> <li>如果我理解正确,这将在内存中创建两个dataframe副本:一个在Python中,一个在R中。这意味着我的内存需求将增加一倍,而且我甚至还没有开始运行统计测试!在</li> </ol> <p>有没有办法:</p> <ol> <li>在Python和R之间更快地传输大数据帧?在</li> <li>访问内存中的同一对象?我怀疑这是在问月亮。在</li> </ol>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>目前,<a href="https://github.com/wesm/feather" rel="nofollow noreferrer">^{<cd1>}</a>似乎是R和pandas之间数据交换的最有效的选择。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
jupyter运行一个旧的pytorch版本
6 回答
Jupyter运行不同版本的卸载库?
1 回答
Jupyter运行指定的键盘快捷键
8 回答
Jupyter通过.local文件“逃逸”virtualenv。我该如何缓解这种情况?
10 回答
Jupyter重新加载自定义样式
7 回答
Jupyter错误:“没有名为Jupyter_core.paths的模块”
4 回答
jupyter错误:无法在随机林中将决策树视为png
3 回答
Jupyter错误'内核似乎已经死亡,它将自动重新启动'为一个给定的代码块
1 回答
Jupyter错误地用阿拉伯语和字母数字元素显示Python列表
6 回答
Jupyter隐藏数据帧索引,但保留原始样式
10 回答
Jupyter集线器:启动器中出现致命错误。。。系统找不到指定的文件
7 回答
Jupyther中相同值的相同哈希,但导出到Bigquery时不相同
6 回答
Jupy上Python的读/写访问问题
8 回答
jupy上没有模块cv
10 回答
Jupy上的排序错误
9 回答
Jupy中bqplot图形的紧凑布局
5 回答
Jupy中matplotlib plot的连续更新
10 回答
Jupy中Numpy函数的文档
7 回答
Jupy中Pandas的自动完成问题
10 回答
jupy中Qt后端的Matplotlib动画
3 回答