numpy 中相当于 R 的 summary() 的功能是什么?

57 投票
3 回答
59473 浏览
提问于 2025-05-10 23:46

有没有类似于 Rsummary() 函数的功能在 numpy 中呢?

numpy 有单独的标准差、平均数和加权平均数的函数,但它有没有一个可以把所有这些信息汇总在一起的函数,就像 R 中的 summary 函数那样?

我找到了一些相关的问题,比如这个是关于 pandas 的,还有这个文章讲的是 Rnumpy 的对应关系,但都没有我想要的功能。

相关文章:

  • 暂无相关问题
暂无标签

3 个回答

3

如果你想要在R语言中获取像summary()这样的详细信息,也就是:

  • 数值变量的五点概述
  • 分类变量中每个类别出现的频率

在Python中,你可以使用df.describe(include= 'all')来实现以上功能。

57

1. 在控制台中加载Pandas并导入csv数据文件

import pandas as pd

data = pd.read_csv("data.csv", sep = ",")

2. 查看数据的前几行

data.head() 

3. 计算总结统计数据

summary = data.describe()

4. 转置统计数据,使其格式类似于R的summary()函数

summary = summary.transpose()

5. 在控制台中可视化总结统计数据

summary.head()
12

不行。你需要使用 pandas

R是一种用于统计的编程语言,所以当你启动它时,很多基本功能,比如 summary()lm(),都是直接可以用的。而Python用途很多,所以你需要安装并导入合适的统计包。numpy 不是一个统计包,它主要用于数值计算,因此你需要使用像 pandasscipystatsmodels 这样的包,才能让Python实现R那种开箱即用的功能。

撰写回答