从Apply to New Columns拆分元组列表的列

df = pd.DataFrame( {'tod': [[('a',10),('b',6),('h',3),('p',2)], [('x',11),('e',2),('l',2)], [('r',5),('l',5)], [('n',15)]]}) tod 0 [(a, 10), (b, 6), (h, 3), (p, 2)] 1 [(x, 11), (e, 2), (l, 2)] 2 [(r, 5), (l, 5)] 3 [(n, 15)]

pd.DataFrame.from_records([{k: v for v, k in row} for row in df.tod]) Out[171]: 2 3 5 6 10 11 15 0 p h NaN b a NaN NaN 1 l NaN NaN NaN NaN x NaN 2 NaN NaN l NaN NaN NaN NaN 3 NaN NaN NaN NaN NaN NaN n

2条回答

网友

1楼 · 编辑于 2024-04-18 23:59:51

n = max([len(row) for row in df.tod])
f = lambda l: sum(l, ()) + ('-', np.nan)*(n-len(l))
l = [list(f(row)) for row in df.tod]

ndf = pd.DataFrame(l,columns='l1   n1  l2    n2 l3    n3  l4    n4'.split())
#  l1  n1 l2   n2 l3   n3 l4   n4
#0  a  10  b  6.0  h  3.0  p  2.0
#1  x  11  e  2.0  l  2.0  -  NaN
#2  r   5  l  5.0  -  NaN  -  NaN
#3  n  15  -  NaN  -  NaN  -  NaN

df.join(ndf)
#
#                                 tod l1  n1 l2   n2 l3   n3 l4   n4
#0  [(a, 10), (b, 6), (h, 3), (p, 2)]  a  10  b  6.0  h  3.0  p  2.0
#1          [(x, 11), (e, 2), (l, 2)]  x  11  e  2.0  l  2.0  -  NaN
#2                   [(r, 5), (l, 5)]  r   5  l  5.0  -  NaN  -  NaN
#3                          [(n, 15)]  n  15  -  NaN  -  NaN  -  NaN

网友

2楼 · 编辑于 2024-04-18 23:59:51

您可以展开元组，然后按生成器创建列名称，最后一个^{}到原始数据帧：

#https://stackoverflow.com/a/45122198/2901002
def mygen(lst):
    for item in lst:
        yield 'l{}'.format(item)
        yield 'n{}'.format(item)

df1 = pd.DataFrame([[b for a in row for b in a] for row in df.tod])
df1.columns = list(mygen(range(1, len(df1.columns) // 2 + 1)))
print(df1)
  l1  n1    l2   n2    l3   n3    l4   n4
0  a  10     b  6.0     h  3.0     p  2.0
1  x  11     e  2.0     l  2.0  None  NaN
2  r   5     l  5.0  None  NaN  None  NaN
3  n  15  None  NaN  None  NaN  None  NaN

df = df.join(df1)
print (df)
                                 tod l1  n1    l2   n2    l3   n3    l4   n4
0  [(a, 10), (b, 6), (h, 3), (p, 2)]  a  10     b  6.0     h  3.0     p  2.0
1          [(x, 11), (e, 2), (l, 2)]  x  11     e  2.0     l  2.0  None  NaN
2                   [(r, 5), (l, 5)]  r   5     l  5.0  None  NaN  None  NaN
3                          [(n, 15)]  n  15  None  NaN  None  NaN  None  NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章