将数据帧一分为二并使用tilde~作为variab

def server_latam(df): df.rename(columns={'Computer:OSI':'OSI'}, inplace=True) df = df[~(df.teste.isin(["Place"]))] df1 = df.loc[df.model != 'Virtual Platform', 'model'].count() print("LATAM") print("Physical Servers: ",df1) df2 = df.loc[df.model == 'Virtual Platform', 'model'].count() print("Virtual Servers: ",df2) df3 = df.groupby('platformName').size().reset_index(name='by OS: ') print(df3) def server_latam_without_tilde(df): df.rename(columns={'Computer:OSI':'OSI'}, inplace=True) df = df[(df.teste.isin(["Place"]))] df1 = df.loc[df.model != 'Virtual Platform', 'model'].count() print("LATAM") print("Physical Servers: ",df1) df2 = df.loc[df.model == 'Virtual Platform', 'model'].count() print("Virtual Servers: ",df2) df3 = df.groupby('platformName').size().reset_index(name='by OS: ') print(df3)

2条回答

网友

1楼 · 编辑于 2024-06-12 21:18:59

对于您有限的用例，您所请求的内容所带来的好处是有限的。你知道吗

分组方式

然而，你真正的问题是你必须创建的变量的数量。您可以通过GroupBy和计算石斑鱼将它们减半：

df = pd.DataFrame({'teste': ['Place', 'Null', 'Something', 'Place'],
                   'value': [1, 2, 3, 4]})

dfs = dict(tuple(df.groupby(df['teste'] == 'Place')))

{False:        teste  value
        1       Null      2
        2  Something      3,

 True:         teste  value
            0  Place      1
            3  Place      4}

然后通过dfs[0]和dfs[1]访问数据帧，因为False == 0和True == 1。最后一个例子有一个好处。现在不需要创建不必要的新变量。数据帧是有组织的，因为它们存在于同一个字典中。你知道吗

功能调度

通过operator模块和一个标识函数可以满足您的精确需求：

from operator import invert

tilde = [invert, lambda x: x]

mask = df.teste == 'Place'  # don't repeat mask calculations unnecessarily

df1 = df[tilde[0](mask)]
df2 = df[tilde[1](mask)]

顺序拆包

如果您打算使用一行，请使用序列解包：

df1, df2 = (df[func(mask)] for func in tilde)

注意：您可以通过以下方式复制GroupBy结果：

dfs = dict(enumerate(df[func(mask)] for func in tilde)

但这是冗长和复杂的。坚持使用GroupBy解决方案。你知道吗

网友

2楼 · 编辑于 2024-06-12 21:18:59

您可以通过定义测试，然后对这些测试进行迭代，来稍微压缩代码。让我举例说明：

tests = ["Place", "Foo", "Bar"]

for t in tests:
    # not sure what you are doing exactly, just copied it
    1 - df = df[~(df.teste.isin([t]))] 
    2 - df = df[(df.teste.isin([t]))]

这样，实际工作只有两行，只需将另一个测试添加到列表中即可避免重复代码。不知道这是不是你想要的。你知道吗

分组方式

功能调度

顺序拆包

相关问题更多 >

编程相关推荐

热门问题

热门文章