有没有方法可以访问python/rpy2中的R数据帧列名？

2条回答

网友

1楼 · 编辑于 2024-06-01 04:02:56

如果在python中运行R代码，全局环境答案将不起作用。但是这个包的创建者/维护者@lgautier值得称赞。在R中，美元符号$经常使用。这是我学到的：

print(pamk_clusters$pamobject$clusinfo)

不会起作用，以及它的等效物

^{pr2}$

也不会起作用。。。不过，在挖了一番“男人”之后

http://rpy2.readthedocs.io/en/version_2.7.x/vector.html#extracting-r-style

通过代表R函数[和[]的两个delegator rx和rx2授予对R样式提取/子集的访问

这和预期的一样

print(pamk_clusters.rx2("pamobject").rx2("clusinfo"))

我在论坛上评论了“男人”的清晰性：

https://bitbucket.org/rpy2/rpy2/issues/436/acessing-dataframe-elements-using-rpy2

我在Win7和ipython上使用rpy2。为了帮助其他人了解格式，下面是一个似乎有效的设置：

import rpy2
import rpy2.robjects as robjects
import rpy2.robjects.packages as rpackages
from rpy2.robjects.packages import importr

base = importr('base')
utils = importr('utils')
utils.chooseCRANmirror(ind=1)

cluster = importr('cluster')
stats = importr('stats')
#utils.install_packages("fpc")
fpc = importr('fpc')

import pickle
with open ('points', 'rb') as fp:
    points = pickle.load(fp) 
# data above is stored as binary object
# online:  http://www.mshaffer.com/arizona/dissertation/points

import rpy2.robjects.numpy2ri as npr   
npr.activate()

k = robjects.IntVector(range(3, 8))   # r-syntax  3:7   # I expect 5
pamk_clusters = fpc.pamk(points,k)

print( base.summary(pamk_clusters) )
base.print( base.summary(pamk_clusters) )

utils.str(pamk_clusters)

print(pamk_clusters$pamobject$clusinfo)
base.print(pamk_clusters$pamobject$clusinfo)

print(pamk_clusters[["pamobject"]][["clusinfo"]])
print(pamk_clusters.rx2("pamobject").rx2("clusinfo"))

pam_clusters = cluster.pam(points,5)        # much slower
kmeans_clusters = stats.kmeans(points,5)    # much faster

utils.str(kmeans_clusters)

print(kmeans_clusters.rx2("cluster"))

近25年来，R一直是统计计算的标准，基于一个40岁的S背景，当时计算效率非常重要。 https://en.wikipedia.org/wiki/R_(programming_language)

再次感谢@lgautier让R在Python中更容易访问

网友

2楼 · 编辑于 2024-06-01 04:02:56

当执行以下操作时，您将把Database02.Rda的任何对象加载到R的“全局环境”中。在

import rpy2.robjects as robjects
robjects.r.load("Database02.Rda")

robjects.globalenv是一个Environement。您可以通过以下方式列出其内容：

^{pr2}$

现在我了解到您的一个对象名为df。您可以通过以下方式访问它：

df = robjects.globalenv['df']

如果df是一个列表或数据框，则可以使用 rx2（这里又是the doc is your friend）。要获得名为REGION的文件，请执行以下操作：

df.rx2("REGION")

要列出列表或数据框中的所有命名元素，请执行以下操作：

tuple(df.names)

http://rpy2.readthedocs.io/en/version_2.7.x/vector.html#extracting-r-style

通过代表R函数[和[]的两个delegator rx和rx2授予对R样式提取/子集的访问

相关问题更多 >

编程相关推荐

热门问题

热门文章