我有一个格式为(name,[token1, token2, ...])
的RDD,name
是键,token
是值。例如:(Robert,['hello', 'movie', '', 'cinema'])
,我想用map
删除值中的空字符串。在
我的尝试是:
new_tuple = tuple.map(lambda x: (x[0], [s for s in x[1] if len(s)>0]))
获得(Robert,['hello', 'movie', 'cinema'])
但我觉得有一种不那么多余的方法吗?在
之后,我想删除在我上面的操作之后可能没有任何值(标记)的项,下面的操作可以吗?公司名称:
^{pr2}$
试试这个:
a = (Robert,['hello', 'movie', '', 'cinema'])
然后
a = (a[0], list(filter(None, a[1])))
这是从sequence中删除None、False、0、“”、“”的最佳方法
相关问题 更多 >
编程相关推荐