循环函数检测每列中的异常值时出错

2024-05-23 22:27:09 发布

男 | 程序猿一只，喜欢编程写python代码。

我创建了一个函数来检测dataset中每列的异常值，不需要反复调用它，所以我创建了一个循环，为dataset中的每列迭代该函数。它返回错误TypeError: unsupported operand type(s) for -: 'numpy.str_' and 'numpy.str_'，我不知道为什么会发生这种情况，它只在我使用循环时出错，但当使用列作为参数（如detectoutliers(avo_sales.AveragePrice)）单独调用它时，错误不会发生。如何解决这个问题

import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
from sklearn.impute import SimpleImputer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
import scipy.stats as ss

avo_sales = pd.read_csv('avocados.csv')

avo_sales.rename(columns = {'4046':'small PLU sold',
                            '4225':'large PLU sold',
                            '4770':'xlarge PLU sold'},
                 inplace= True)

avo_sales.columns = avo_sales.columns.str.replace(' ','')

print('Data has some outliers, we''ll''be handling outliers then impute missing values with median')

def detectoutliers(column):
    numbers = sorted(column)
    q1, q3 = np.percentile(column, [25,75] , interpolation='nearest')
    print('Q1,Q3 : ',q1,q3)
    iqr = q3 - q1
    lowerBound = q1 - (1.5 * iqr)
    upperBound = q3 + (1.5 * iqr)
    print('lowerBound,upperBound : ',lowerBound,upperBound)
    print('Detection Success')
    return lowerBound,upperBound

for column in avo_sales.columns[2:11]:
    detectoutliers(column)

Tags： columns from import numpy as column print sales

1条回答

网友

1楼 · 发布于 2024-05-23 22:27:09

我想这是因为你的代码

for column in avo_sales.columns[2:11]:
    detectoutliers(column)

对数据帧的列名进行操作。您可以将其更改为：

for column in avo_sales.columns[2:11]: detectoutliers(avo_sales[column])

循环函数检测每列中的异常值时出错

相关问题更多 >

编程相关推荐

热门问题

热门文章

循环函数检测每列中的异常值时出错

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >