在列表中查找子字符串匹配的每个匹配项并生成单个字符串

new_list = [] last_column = "" for element in list1: for otherelement in list 2: if last_column == "" : last_column += otherelement[3] else: last_column += "," + otherelement[3] new_list.append(element.split(" ")[0:2] + " " + last_column)

3条回答

网友

1楼 · 编辑于 2024-06-06 04:57:12

用你的实际数据展开上一个答案：

from collections import defaultdict

data = [
  "11333    55555   EG  455565",
  "11332    55555   EG  455563",
  "11333    55555   EG  455562"
]

vars_by_common = defaultdict(list)
for d in data:
  parts = d.split("\t")
  common = tuple(parts[:3])  # so it can be a key in a dict
  var = parts[3]

  vars_by_common[common].append(var)

# now rebuild list
new_data = []
for c, v in vars_by_common.items():
  new_data.append("\t".join(c) + "\t" + ",".join(v))

print(new_data)

网友

2楼 · 编辑于 2024-06-06 04:57:12

为了收集和分组数据，^{}似乎是一个很好的选择。请参见下面的示例。你知道吗

from collections import defaultdict

data = [
    [1, 1, 1, 'a'],
    [1, 1, 1, 'b'],
    [1, 1, 2, 'c'],
    [2, 1, 1, 'd'],
]

accumulator = defaultdict(list)
for row in data:
    # use a tuple of the first three elements as the key
    # append the fourth element to a list tracking the values
    accumulator[tuple(row[:-1])].append(row[-1])

print accumulator
# defaultdict(<type 'list'>, {(1, 1, 1): ['a', 'b'], (2, 1, 1): ['d'], (1, 1, 2): ['c']})

将数据转换成本例中使用的表单应该很容易，而获得所需的输出应该正好相反。你知道吗

网友

3楼 · 编辑于 2024-06-06 04:57:12

谢谢大家！使用defaultdict的解决方案要快得多。我从来没有正式计时，但我的解决方案运行了6秒，现在我看大约一秒，也许更少。当要附加的变量项的数量变大时（显然），这显示出显著的改进。你知道吗

我想，唯一的缺点就是因为字典不完美而失去秩序。但秩序对我来说并不重要。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章