如何使用apply for two column including list返回一列中的索引，并使用另一列中的元素？

a b c ['1', '2', '5'] ['2'] 2 ['2','3','4'] ['4'] 3 ['2','3','4'] [] 0 [] [] 0 ...

2条回答

网友

1楼 · 编辑于 2024-04-25 19:46:06

通过读入数据，使数据类型成为列表，我能够创建一个apply函数，该函数为c创建值：

import io, ast

#a b
#['1','2','5'] ['2']
#['2','3','4'] ['4']
#['2','3','4'] []
#[] []

csvfile=io.StringIO("""a b
['1','2','5'] ['2']
['2','3','4'] ['4']
['2','3','4'] []
[] []""")

df = pd.read_csv(csvfile, sep=' ', converters={'a' : ast.literal_eval, 'b' : ast.literal_eval }) 

def a_b_index(hm):
  if hm.b != []:
     return hm.a.index(hm.b[0])
  else:
     return 0

df['c'] = df.apply(a_b_index, axis=1)

df.c
#           a    b  c
#0  [1, 2, 5]  [2]  1
#1  [2, 3, 4]  [4]  2
#2  [2, 3, 4]   []  0
#3         []   []  0

网友

2楼 · 编辑于 2024-04-25 19:46:06

首先，这里是一个使用.apply()的基本方法。你知道吗

import pandas as pd
import numpy as np

list_a = [['1', '2', '5'], ['2', '3', '4'], ['2', '3', '4'], []]
list_b = [['2'], ['4'], [], []]

df_1 = pd.DataFrame(data=zip(list_a, list_b), columns=['a', 'b'])

df_1['a'] = df_1['a'].map(lambda x: x if x else np.NaN)
df_1['b'] = df_1['b'].map(lambda x: x[0] if x else np.NaN)
#df_1['b'] = df_1['b'].map(lambda x: next(iter(x), np.NaN))


def calc_c(curr_row: pd.Series) -> int:
    if curr_row['a'] is np.NaN or curr_row['b'] is np.NaN:
        return 0
    else:
        return curr_row['a'].index(curr_row['b'])


df_1['c'] = df_1[['a', 'b']].apply(func=calc_c, axis=1)

df_1结果：

    a                  b    c
          -   -   -
 0  ['1', '2', '5']    2    1
 1  ['2', '3', '4']    4    2
 2  ['2', '3', '4']  nan    0
 3  nan              nan    0

我用NaN替换了空列表，我发现它更加习惯和实用。你知道吗

这显然不是一个理想的解决方案，我会努力找到别的办法。显然，我们对你的程序和数据帧的了解越多越好。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用apply for two column including list返回一列中的索引，并使用另一列中的元素？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >