我怎么把R数据框导入Pandas？

2条回答

网友

1楼 · 编辑于 2024-04-24 10:27:16

%load_ext rmagic
%R rdf = data.frame(a=c(2, 3, 5), b=c("aa", "bb", "cc"), c=c(TRUE, FALSE, TRUE))

import pandas.rpy.common as com

print com.load_data('rdf')
   a   b      c
1  2  aa   True
2  3  bb  False
3  5  cc   True

网友

2楼 · 编辑于 2024-04-24 10:27:16

首先：array([(2.0, 1, 1), (3.0, 2, 0), (5.0, 3, 1)], dtype=[('a', '<f8'), ('b', '<i4'), ('c', '<i4')])。这是一个numpy结构的array。http://docs.scipy.org/doc/numpy/user/basics.rec.html/。您可以使用pd.DataFrame轻松地将其转换为pandasDF：

In [65]:

from numpy import *
print pd.DataFrame(array([(2.0, 1, 1), (3.0, 2, 0), (5.0, 3, 1)], dtype=[('a', '<f8'), ('b', '<i4'), ('c', '<i4')]))
   a  b  c
0  2  1  1
1  3  2  0
2  5  3  1

b列被编码（就像factor()在R）中被编码，c列从boolean转换为int。a从int转换为float（'<f8'，实际上我发现这是意外的）

第二，我认为pandas.rpy.common是从R:http://pandas.pydata.org/pandas-docs/stable/r_interface.html获取数据的最方便的方法（它可能太短了，所以我在这里再加一个例子）：

^{pr2}$

最后，Unnamed: 0列是索引列。您可以通过向index_col=0提供index_col=0来避免它

相关问题更多 >

编程相关推荐

热门问题

热门文章