rpy2 转换矩阵为数据框

4 投票
1 回答
1781 浏览
提问于 2025-04-16 19:15

我在处理一个看起来很简单的操作时遇到了困难,我本以为这个问题之前应该有人解决过,但我找不到任何例子。

在R环境中,@data是一个数据框(DataFrame),但是rpy2(2.2)返回的是一个矩阵(Matrix)。有没有什么方便的方法可以把这个矩阵转换成数据框,或者让robjects.r(query)返回一个数据框呢?

from rpy2.robjects.packages import importr
import rpy2.robjects as robjects

fimport = importr('fImport')

yahooImport = robjects.r('function(x) yahooImport(x)@data')
qqq = yahooImport("QQQ")

print type(qqq)

1 个回答

2

你可以尝试在你的yahooImport函数中明确地把结果转换成一个数据框(data.frame)。

下面的代码对我有效:

>>> yahooImport = robjects.r('function(x) as.data.frame(yahooImport(x)@data)')

>>> print type(qqq)
<class 'rpy2.robjects.vectors.DataFrame'>
>>> qqq
<DataFrame - Python:0x102412680 / R:0x103c2b310>
[Float..., Float..., Float..., Float..., Float..., Float...]
  Open: <class 'rpy2.robjects.vectors.FloatVector'>
  <FloatVector - Python:0x10241a638 / R:0x1048f1c00>
[58.970000, 58.660000, 59.180000, ..., 102.250000, 102.870000, 102.250000]
  High: <class 'rpy2.robjects.vectors.FloatVector'>
  <FloatVector - Python:0x10241acf8 / R:0x104916000>
[59.700000, 59.320000, 59.190000, ..., 102.310000, 103.470000, 102.310000]
  Low: <class 'rpy2.robjects.vectors.FloatVector'>
  <FloatVector - Python:0x10241add0 / R:0x10491c200>
[58.920000, 58.340000, 58.500000, ..., 99.310000, 100.620000, 100.560000]
  Close: <class 'rpy2.robjects.vectors.FloatVector'>
  <FloatVector - Python:0x10241aef0 / R:0x10486f800>
[59.600000, 58.990000, 58.600000, ..., 100.120000, 102.620000, 102.120000]
  Volume: <class 'rpy2.robjects.vectors.FloatVector'>
  <FloatVector - Python:0x10241d050 / R:0x104875a00>
[43540100.000000, 70148800.000000, 57085500.000000, ..., 8743600.000000, 9688600.000000, 5232000.000000]
  Adj.Close: <class 'rpy2.robjects.vectors.FloatVector'>
  <FloatVector - Python:0x10241d170 / R:0x10485a000>
[59.600000, 58.990000, 58.600000, ..., 48.110000, 49.320000, 49.080000]

yahooImport返回的是一个时间序列对象,这个对象在内部是以矩阵的形式存储的,这就是为什么你在rpy2中得到的返回值是矩阵的原因。

撰写回答