基于子列表中的字母数字字符串对列表的自然排序？

2 投票

2 回答

1057 浏览

提问于 2025-04-17 21:20

这事儿真让人摸不着头脑，对吧？我先给个例子...

my_list = [[4,'A4, A23, A3, A6', 'Description 1', 'Property 1'],
           [4,'B3, B35, B10, B22', 'Description 2', 'Property 2'],
           [6,'A1, A11, A10, A21, A2, A22', 'Description 3', 'Property 3']]

应该排序成：

>>>my_list:
[[6,'A1, A2, A10, A11, A21,  A22', 'Description 3', 'Property 3'] 
 [4,'A3, A4, A6, A23', 'Description 1', 'Property 1'],
 [4,'B3, B10, B22, B35', 'Description 2', 'Property 2']]

所以，我首先需要对每个子列表的第二个元素进行自然排序，然后再根据子列表中第二个元素的字符串对所有列表进行自然排序。我今天一直在为这个问题苦恼，所以我之前尝试的代码可能会让事情变得更复杂。

也许我最开始的例子不够全面，但这是我根据@Ashwini的代码得到的结果：

[[ 1,   'C1', 'DW-00232'],
 [3,    'C11, C32, C46', 'DW-6546'],
 [7,    'C16, C17, C18, C19, C20, C21, C25', 'DW-545'],
 [5,    'C2, C3, C4, C5, C63', 'DW-7657'],
 [1,    'C26', 'DW-0056'],
 [2,    'C59, C60', 'DW-23424'],
 [5,    'C6, C13, C24, C30, C64', 'DW-5345']]

我希望输出能是这样的：

[[ 1,   'C1', 'DW-00232'],
 [5,    'C2, C3, C4, C5, C63', 'DW-7657'],
 [5,    'C6, C13, C24, C30, C64', 'DW-5345'],
 [3,    'C11, C32, C46', 'DW-6546'],
 [7,    'C16, C17, C18, C19, C20, C21, C25', 'DW-545'],
 [1,    'C26', 'DW-0056'],
 [2,    'C59, C60', 'DW-23424']]

目标总是在变。 现在我还得考虑一种情况，就是有些字母数字组合是放在括号里的。我需要在排序时忽略这些括号。

例子：

[[ 1, 'C1', 'DW-00232'],
 [ 7, '(C21), C16, (C7), (C18), C19, C6, C65', 'DW-545'],
 [ 5, ' C4, (C2), C3, C10, (C5)', 'DW-7657']]

排序后变成这样：

[[ 1, 'C1', 'DW-00232'],
 [ 5, '(C2), C3, C4, (C5), C10', 'DW-7657'],    
 [ 7, 'C6, (C7), C16, (C18), C19, (C21), C65', 'DW-545']]

好吧，上面的情况其实是个“简单”的修复，等我仔细看了Ashwini的代码后。我在他的自然排序函数中添加了翻译语句，具体如下，因为他处理的关键函数正好是我想要的排序方式，只有逐行排序不太对。

        alphanum_key = (lambda key:
                        [convert(c.translate(None, punctuation + whitespace)) for c in re.split('([0-9]+)', key)])

代码优化数据结构字符串处理编程技巧排序算法列表处理自然排序字母数字字符串

2 个回答

默认情况下，sort 是使用内置的 cmp 来比较元素的。我想是这样的，但你可以这样做：

my_list.sort(key = lambda x: x[1])

这会告诉它使用每个子列表的第一个元素作为比较的关键。

补充说明：不使用匿名函数（lambdas）...

from operator import itemgetter
my_list.sort(key = itemgetter(1))

回答于 2025-04-17 由 Python大师

分享举报

使用来自这个回答的natural_sort函数，你可以这样做：

import re
from string import punctuation as punc, whitespace as wt
from pprint import pprint

def natural_sort(l): 
    #https://stackoverflow.com/a/4836734/846892
    convert = lambda text: int(text) if text.isdigit() else text.lower() 
    alphanum_key = lambda key: [ convert(c) for c in re.split('([0-9]+)', key) ] 
    return sorted(l, key = alphanum_key)

def key(seq):                                           
    convert = lambda text: int(text) if text.isdigit() else text.lower() 
    return [convert(c.translate(None, punc+wt)) for c in re.split('([0-9]+)', seq)]
... 
>>> my_list = [[ 1,   'C1', 'DW-00232'],
 [3,    'C11, C32, C46', 'DW-6546'],
 [7,    'C16, C17, C18, C19, C20, C21, C25', 'DW-545'],
 [5,    'C2, C3, C4, C5, C63', 'DW-7657'],
 [1,    'C26', 'DW-0056'],
 [2,    'C59, C60', 'DW-23424'],
 [5,    'C6, C13, C24, C30, C64', 'DW-5345']]
>>> 
>>> new_lis = [x[:1] + [", ".join(natural_sort(x[1].split(', ')))] + x[2:]
                                                                for x in my_list]
>>> new_lis.sort(key = lambda x:key(x[1]))               
>>> pprint(new_lis)
[[1, 'C1', 'DW-00232'],
 [5, 'C2, C3, C4, C5, C63', 'DW-7657'],
 [5, 'C6, C13, C24, C30, C64', 'DW-5345'],
 [3, 'C11, C32, C46', 'DW-6546'],
 [7, 'C16, C17, C18, C19, C20, C21, C25', 'DW-545'],
 [1, 'C26', 'DW-0056'],
 [2, 'C59, C60', 'DW-23424']]
>>>

回答于 2025-04-17 由 Python大师

分享举报

基于子列表中的字母数字字符串对列表的自然排序？

2 个回答

撰写回答