带有遮罩和变换的Groupby

POLY_KEY_I Class SP_Percent FS01080100SM001 NA 5.0 MTGP 67.5 Meadow 25.0 Woodland 2.5 FS01080100SM002 PHP 85.0 SP 15.0

2条回答

网友

1楼 · 编辑于 2024-04-26 00:42:52

我是这样做的：

df ['mask'] = ((df['Class'] == 'Meadow') & (df['SP_Percent'] >=20))
df2 = df[(df['mask']==True)][['POLY_KEY_I']]
df2['mask2']=True
df = pd.merge(df,df2,how='left')
df.ix[((df['mask2']==True) & (df['Class']=='MTGP')),'Class'] = 'WMTGP'

网友

2楼 · 编辑于 2024-04-26 00:42:52

我用apply自定义函数f将您的解决方案完全更改为groupby。对于检查字符串值，最好使用^{}。在

输入（增加第5行用于测试）：

        POLY_KEY_I     Class  SP_Percent
0  FS01080100SM001       NaN         5.0
1  FS01080100SM001      MTGP        67.5
2  FS01080100SM001    Meadow        25.0
3  FS01080100SM001  Woodland         2.5
4  FS01080100SM002       PHP        85.0
5  FS01080100SM002      MTGP        85.0
6  FS01080100SM002        SP        15.0

^{pr2}$

编辑1：

添加时间：

^{3}$

时间来源：

import pandas as pd
import numpy as np
import io

temp=u"""POLY_KEY_I;Class;SP_Percent
FS01080100SM001;NA;5.0
FS01080100SM001;MTGP;67.5
FS01080100SM001;Meadow;25.0
FS01080100SM001;Woodland;2.5
FS01080100SM002;PHP;85.0
FS01080100SM002;MTGP;85.0
FS01080100SM002;SP;15.0"""

df = pd.read_csv(io.StringIO(temp), sep=";", index_col=None, parse_dates=False)
print df
print df.dtypes
print df.index

def shahram(df):
    df ['mask'] = ((df['Class'] == 'Meadow') & (df['SP_Percent'] >=20))
    df2 = df[(df['mask']==True)][['POLY_KEY_I']]
    df2['mask2']=True
    df = pd.merge(df,df2,how='left')
    df.ix[((df['mask2']==True) & (df['Class']=='MTGP')),'Class'] = 'WMTGP'
    return df

def f(g):
    if ((g['Class'].isin(['Meadow'])) & (g['SP_Percent'] >=20)).any():
       g['Class'].loc[g['Class'].isin(['MTGP'])] = 'WMTGP'
       return g
    else:
       return g

print df.groupby(['POLY_KEY_I']).apply(f)
print shahram(df)

相关问题更多 >

编程相关推荐

热门问题

热门文章

带有遮罩和变换的Groupby

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >