从R转到Python，Python等价于数据帧是什么？

id1 id2 text score 123 889 "This is the text I need to read..." 88 234 778 "This is the text I need to read..." 78 345 667 "This is the text I need to read..." 91

3条回答

网友

1楼 · 编辑于 2024-04-27 14:29:56

我不确定这是否能很好地转换成我从未使用过的“R”，但在Python中，我将如何处理它：

lines = list()
with open('data.txt','r') as f:
  for line in f:
      lines.append(line.split())

它将读取python列表中的所有内容。列表是基于零的。要从第二行获取文本列，请执行以下操作：

print lines[1][2]

那一行的分数是：

print lines[1][3]

网友

2楼 · 编辑于 2024-04-27 14:29:56

看看pandas库中的DataFrame对象。

网友

3楼 · 编辑于 2024-04-27 14:29:56

Ullrich先生使用pandas库的答案是最接近R数据帧的方法。但是，如果需要，您可以使用numpy array获得非常相似的功能，数据类型设置为object。新版本的numpy有类似于a的data.frame的field name capabilities，它的索引实际上比R的索引更强大，它包含对象的能力远远超出R的能力。

我同时使用R和numpy，这取决于手头的任务。使用公式和内置的统计数据，R更好。Python代码更易于维护，也更容易连接到其他系统。

已编辑：添加了注意，numpy现在具有字段名功能

相关问题更多 >

编程相关推荐

热门问题

热门文章