从元组RDD中删除空字符串

2024-04-26 14:44:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个格式为(name,[token1, token2, ...])的RDD,name是键,token是值。例如:(Robert,['hello', 'movie', '', 'cinema']),我想用map删除值中的空字符串。在

我的尝试是:

new_tuple = tuple.map(lambda x: (x[0], [s for s in x[1] if len(s)>0]))

获得(Robert,['hello', 'movie', 'cinema'])

但我觉得有一种不那么多余的方法吗?在

之后,我想删除在我上面的操作之后可能没有任何值(标记)的项,下面的操作可以吗?公司名称:

^{pr2}$

Tags: lambda字符串nametokenmaphellonew格式
1条回答
网友
1楼 · 发布于 2024-04-26 14:44:10

试试这个: a = (Robert,['hello', 'movie', '', 'cinema'])

然后a = (a[0], list(filter(None, a[1])))

这是从sequence中删除None、False、0、“”、“”的最佳方法

相关问题 更多 >