将数字列表转换为字符串范围问题的回答

将数字列表转换为字符串范围

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我想知道是否有一种简单的（或已经创建的）方法来做与此相反的事情：<a href="http://code.activestate.com/recipes/577279-generate-list-of-numbers-from-hyphenated-and-comma/" rel="nofollow noreferrer">Generate List of Numbers from Hyphenated...</a>。此链接可用于： <pre><code>>> list(hyphen_range('1-9,12,15-20,23')) [1, 2, 3, 4, 5, 6, 7, 8, 9, 12, 15, 16, 17, 18, 19, 20, 23]: </code></pre> 我希望做相反的事情（注意10和21包含在内，所以它与range函数兼容，其中range（1,10）=[1,2,3,4,5,6,7,8,9]）： <pre><code>>> list_to_ranges([1, 2, 3, 4, 5, 6, 7, 8, 9, 12, 15, 16, 17, 18, 19, 20, 23]) '1-10,12,15-21,23' </code></pre> 最后，我希望输出也包含一个步骤，其中最后一个输出数表示该步骤： <pre><code>>> list_to_ranges([1, 3, 5, 7, 8, 9, 10, 11]) '1-13:2,8,10' </code></pre> 从本质上讲，这会有点像一个“逆”范围函数 <pre><code>>> tmp = list_to_ranges([1, 3, 5]) >> print tmp '1-7:2' >> range(1, 7, 2) [1, 3, 5] </code></pre> 我的猜测是没有真正简单的方法来做到这一点，但我想我会问在这里之前，我去做一些蛮力，长的方法。 编辑 以<a href="https://stackoverflow.com/questions/3149440/python-splitting-list-based-on-missing-numbers-in-a-sequence">this post</a>的答案中的代码为例，我想出了一个简单的方法来完成第一部分。但我认为，确定要执行步骤的模式会有点困难。 <pre><code>from itertools import groupby from operator import itemgetter data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28] print data, '\n' str_list = [] for k, g in groupby(enumerate(data), lambda (i,x):i-x): ilist = map(itemgetter(1), g) print ilist if len(ilist) > 1: str_list.<a href="https://www.cnpython.com/list/append" class="inner-link">append</a>('%d-%d' % (ilist[0], ilist[-1]+1)) else: str_list.append('%d' % ilist[0]) print '\n', ','.join(str_list) </code></pre> 编辑2 这里是我的尝试，包括步骤大小…这是相当接近，但第一个数字得到重复。我认为只要稍微调整一下，它就会接近我想要的——或者至少足够好。 <pre><code>import numpy as np from itertools import groupby def list_to_ranges(data): data = sorted(data) diff_data = np.diff(data).tolist() ranges = [] i = 0 for k, iterable in groupby(diff_data, None): rng = list(iterable) step = rng[0] if len(rng) == 1: ranges.append('%d' % data[i]) elif step == 1: ranges.append('%d-%d' % (data[i], data[i+len(rng)]+step)) else: ranges.append('%d-%d:%d' % (data[i], data[i+len(rng)]+step, step)) i += len(rng) return ','.join(ranges) data = [1, 3, 5, 6, 7, 11, 13, 15, 16, 17, 18, 19, 22, 25, 28] print data data_str = list_to_ranges(data) print data_str _list = [] for r in data_str.replace('-',':').split(','): r = [int(a) for a in r.split(':')] if len(r) == 1: _list.extend(r) elif len(r) == 2: _list.extend(range(r[0], r[1])) else: _list.extend(range(r[0], r[1], r[2])) print _list print list(set(_list)) </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

这是三种方法的比较。通过下面的值更改数据量和密度…不管我使用什么值，第一个解决方案对我来说似乎是最快的。对于非常大的数据集，第三种解决方案变得非常缓慢。 已编辑 编辑以包含以下注释并添加新解决方案。最后的解决办法似乎是现在最快的。 <pre><code>import numpy as np import itertools import random import timeit # --- My Solution -------------------------------------------------------------- def list_to_ranges1(data): data = sorted(data) diff_data = np.diff(data) ranges = [] i = 0 skip_next = False for k, iterable in itertools.groupby(diff_data, None): rng = list(iterable) step = rng[0] if skip_next: skip_next = False rng.pop() if len(rng) == 0: continue elif len(rng) == 1: ranges.append('%d' % data[i]) elif step == 1: ranges.append('%d-%d' % (data[i], data[i+len(rng)]+step)) i += 1 skip_next = True else: ranges.append('%d-%d:%d' % (data[i], data[i+len(rng)]+step, step)) i += 1 skip_next = True i += len(rng) if len(rng) == 0 or len(rng) == 1: ranges.append('%d' % data[i]) return ','.join(ranges) # --- Kaidence Solution -------------------------------------------------------- # With a minor edit for use in range function def list_to_ranges2(data): onediff = np.diff(data) twodiff = np.diff(onediff) increments, breakingindices = [], [] for i in range(len(twodiff)): if twodiff[i] != 0: breakingindices.append(i+2) # Correct index because of the two diffs increments.append(onediff[i]) # Record the increment for this section # Increments and breakingindices should be the same size str_list = [] start = data[0] for i in range(len(breakingindices)): str_list.append("%d-%d:%d" % (start, data[breakingindices[i]-1] + increments[i], increments[i])) start = data[breakingindices[i]] str_list.append("%d-%d:%d" % (start, data[len(data)-1] + onediff[len(onediff)-1], onediff[len(onediff)-1])) return ','.join(str_list) # --- Rik Poggi Solution ------------------------------------------------------- # With a minor edit for use in range function def helper(lst): if len(lst) == 1: return str(lst[0]), [] if len(lst) == 2: return ','.join(map(str,lst)), [] step = lst[1] - lst[0] #for i,x,y in itertools.izip(itertools.count(1), lst[1:], lst[2:]): for i,x,y in itertools.izip(itertools.count(1), itertools.islice(lst, 1, None, 1), itertools.islice(lst, 2, None, 1)): if y-x != step: if i > 1: return '{}-{}:{}'.format(lst[0], lst[i]+step, step), lst[i+1:] else: return str(lst[0]), lst[1:] return '{}-{}:{}'.format(lst[0], lst[-1]+step, step), [] def list_to_ranges3(lst): result = [] while lst: partial,lst = helper(lst) result.append(partial) return ','.join(result) # --- Rik Poggi Solution 2 ----------------------------------------------------- def formatter(start, end, step): #return '{}-{}:{}'.format(start, end, step) return '{}-{}:{}'.format(start, end + step, step) def list_to_ranges4(lst): n = len(lst) result = [] scan = 0 while n - scan > 2: step = lst[scan + 1] - lst[scan] if lst[scan + 2] - lst[scan + 1] != step: result.append(str(lst[scan])) scan += 1 continue for j in xrange(scan+2, n-1): if lst[j+1] - lst[j] != step: result.append(formatter(lst[scan], lst[j], step)) scan = j+1 break else: result.append(formatter(lst[scan], lst[-1], step)) return ','.join(result) if n - scan == 1: result.append(str(lst[scan])) elif n - scan == 2: result.append(','.join(itertools.imap(str, lst[scan:]))) return ','.join(result) # --- Test Function ------------------------------------------------------------ def test_data(data, f_to_test): data_str = f_to_test(data) _list = [] for r in data_str.replace('-',':').split(','): r = [int(a) for a in r.split(':')] if len(r) == 1: _list.extend(r) elif len(r) == 2: _list.extend(range(r[0], r[1])) else: _list.extend(range(r[0], r[1], r[2])) return _list # --- Timing Tests ------------------------------------------------------------- # Generate some sample data... data_list = [] for i in range(5): # Note: using the "4000" and "5000" values below, the relative density of # the data can be changed. This has a huge effect on the results # (particularly on the results for list_to_ranges3 which uses recursion). data_list.append(sorted(list(set([random.randint(1,4000) for a in \ range(random.randint(5,5000))])))) testfuncs = list_to_ranges1, list_to_ranges2, list_to_ranges3, list_to_ranges4 for f in testfuncs: print '\n', f.__name__ for i, data in enumerate(data_list): t = timeit.Timer('f(data)', 'from __main__ import data, f') #print f(data) print i, data==test_data(data, f), round(t.timeit(200), 3) </code></pre>

将数字列表转换为字符串范围

1 个回答

相关Python问题