得到scipy.stats公司忽略nan值

2024-04-26 14:01:13 发布

您现在位置：Python中文网/ 问答频道 /正文

9101

网友

男 | 程序猿一只，喜欢编程写python代码。

这是my previous question的后续操作。在

在这个玩具数据集中：

import pandas as pd
import matplotlib.pyplot as plt
import scipy.stats as stats
import numpy as np

dictOne = {'Name':['First', 'Second', 'Third', 'Fourth', 'Fifth', 'Sixth', 'Seventh', 'Eighth', 'Ninth'],
           "A":[1, 2, -3, 4, 5, np.nan, 7, np.nan, 9],
           "B":[4, 5, 6, 5, 3, np.nan, 2, 9, 5],
           "C":[7, np.nan, 10, 5, 8, 6, 8, 2, 4]}
df2 = pd.DataFrame(dictOne)

column = 'C'

df2[df2[column] > -999].hist(column, alpha = 0.5)
param = stats.norm.fit(df2[column], nan_policy = 'omit')   # Fit a normal distribution to the data
print(param)

我试着绘制一个柱状图，上面覆盖了正态分布曲线。scipy.stats.norm.fit给了我[nan, nan]作为param，尽管我在函数调用中使用了nan_policy = 'omit'。在

如何让它忽略dataframe中的NaN值以获得一些合理的统计信息？在

Tags： import norm param as stats np policy column

1条回答

网友

1楼 · 发布于 2024-04-26 14:01:13

我不相信nan_policy是fit使用的关键字。在

在任何情况下，都可以从源数据集中删除空值：

param = stats.norm.fit(df2[column].dropna())

得到scipy.stats公司忽略nan值

相关问题更多 >

编程相关推荐

热门问题

热门文章

得到scipy.stats公司忽略nan值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >