排序映射更有效的Python排序解决方案？

# Demo data data = [ "Option A", # 0 "Option B", # 1 "Blabla", # 2 "Some text" # 3 ] class Item: def __init__(self, label): self.label = label col = [Item(d) for d in data] # Create sorting mapping flt_neworder = [ x[1] for x in sorted( zip( [x[0] for x in sorted(enumerate(col), key=lambda x: x[1].label)], range(len(col)) ) ) ] # Output: [1,2,0,3] print(flt_neworder)

orig: 2.116799074272876 origmod: 2.118176033553482 orignew: 1.1691872433702883 orig3: 1.4400411206224817 orig4: 2.0643228139915664 rewrite: 26.06907118537356 rewriteop: 25.91357442379376 rewriteuniq: 10.783081019086694

1条回答

网友
1楼 · 发布于 2024-06-16 12:55:12

这比原始代码更快，更易于阅读：
data = [ 'Option A', 'Option B', 'Blabla', 'Some text' ] idata = list(enumerate(data)) # add indexes to uniquely identify items sdata = sorted(idata, key=lambda x: x[1]) # sort the items by label flt_neworder = [sdata.index(x) for x in idata] # find the position to move to
timeit结果：
orig: 12.3757910728 origmod: 7.85222291946 orignew: 6.15745902061 rewrite: 6.31552696228
（origmod类似于原始代码，但是没有Item类，因为它看起来不像您使用它；orignew是您的一行代码）
你的一行稍微快一点，但我觉得读起来更难。你知道吗
好的，这次我将包含完整的测试代码。我把Item的创建从orig移走了，因为创建这些只是为了模拟真实世界的数据。除了orig3（您的新代码）和rewriteop（rewrite与operator.itemgetter）之外，我还添加了一个额外的测试rewriteuniq，以避免字符串是唯一的。你知道吗
结果：
orig: 7.641715765 origmod: 7.38071417809 orignew: 5.82565498352 orig3: 5.67061495781 rewrite: 5.95284795761 rewriteop: 5.61896586418 rewriteuniq: 1.90719294548
代码：
import operator from timeit import timeit data = [ 'Option A', 'Option B', 'Blabla', 'Some text', ] desired_output = [1, 2, 0, 3] class Item: def __init__(self, label): self.label = label col = [Item(d) for d in data] def orig(): flt_neworder = [ x[1] for x in sorted( zip( [x[0] for x in sorted(enumerate(col), key=lambda x: x[1].label)], range(len(col)) ) ) ] assert flt_neworder == desired_output def origmod(): flt_neworder = [ x[1] for x in sorted( zip( [x[0] for x in sorted(enumerate(data), key=lambda x: x[1])], range(len(data)) ) ) ] assert flt_neworder == desired_output def orignew(): flt_neworder = list({k: i for i, (k, v) in enumerate(sorted(enumerate(data), key=operator.itemgetter(1)))}.values()) assert flt_neworder == desired_output def orig3(): flt_neworder = [None] * len(col) for j, (_, i) in enumerate(sorted(zip((item.label for item in col), range(len(col))))): flt_neworder[i] = j assert flt_neworder == desired_output def rewrite(): idata = list(enumerate(data)) sdata = sorted(idata, key=lambda x: x[1]) flt_neworder = [sdata.index(x) for x in idata] assert flt_neworder == desired_output def rewriteop(): idata = list(enumerate(data)) sdata = sorted(idata, key=operator.itemgetter(1)) flt_neworder = [sdata.index(x) for x in idata] assert flt_neworder == desired_output def rewriteuniq(): sdata = sorted(data) flt_neworder = [sdata.index(x) for x in data] assert flt_neworder == desired_output for fn in (orig, origmod, orignew, orig3, rewrite, rewriteop, rewriteuniq): print fn.__name__ + ':', timeit(fn)

相关问题更多 >

编程相关推荐

热门问题

热门文章