我有一个 Python 对象列表,我想按每个对象的特定属性对其进行排序:
[Tag(name="toe", count=10), Tag(name="leg", count=2), ...]
如何按
.count
降序排列列表?
就地排序列表:
orig_list.sort(key=lambda x: x.count, reverse=True)
要返回新列表,请使用
sorted
:
new_list = sorted(orig_list, key=lambda x: x.count, reverse=True)
说明:
key=lambda x: x.count
按计数排序。reverse=True
降序排列。更多关于按键排序.
最快的方法是使用
operator.attrgetter("count")
,尤其是当您的列表有很多记录时。但是,这可能会在 Python 的预运算符版本上运行,因此最好有一个回退机制。那么您可能想要执行以下操作:
try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda
ut.sort(key=keyfun, reverse=True) # sort in-place
读者应该注意到 key= 方法:
ut.sort(key=lambda x: x.count, reverse=True)
比向对象添加丰富的比较运算符快很多倍。我很惊讶地读到这篇文章(“Python in a Nutshell”的第 485 页)。您可以通过在这个小程序上运行测试来确认这一点:
#!/usr/bin/env python
import random
class C:
def __init__(self,count):
self.count = count
def __cmp__(self,other):
return cmp(self.count,other.count)
longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]
longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs
我的非常小的测试表明第一种排序要慢 10 倍以上,但书上说它一般只慢 5 倍左右。他们说的原因是由于python中使用的高度优化的排序算法(timsort)。
不过,.sort(lambda) 比普通的 .sort() 更快还是很奇怪的。我希望他们能解决这个问题。
面向对象的方法
如果适用,最好将对象排序逻辑作为类的属性,而不是将其合并到每个需要排序的实例中。
这确保了一致性并消除了对样板代码的需求。
至少,您应该指定
__eq__
和 __lt__
操作才能使其工作。然后只需使用sorted(list_of_objects)
.
class Card(object):
def __init__(self, rank, suit):
self.rank = rank
self.suit = suit
def __eq__(self, other):
return self.rank == other.rank and self.suit == other.suit
def __lt__(self, other):
return self.rank < other.rank
hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand] # [10, 2, 12, 13, 14]
hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted] # [2, 10, 12, 13, 14]
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)
它看起来很像 Django ORM 模型实例列表。
为什么不按这样的查询对它们进行排序:
ut = Tag.objects.order_by('-count')
如果您要排序的属性是property,那么您可以避免导入
operator.attrgetter
并使用属性的fget
方法。
例如,对于具有属性
Circle
的类radius
,我们可以按半径对circles
的列表进行排序,如下所示:
result = sorted(circles, key=Circle.radius.fget)
这不是最广为人知的功能,但经常为我节省导入时间。
此外,如果有人想要对包含字符串和数字的列表进行排序,例如
eglist=[
"some0thing3",
"some0thing2",
"some1thing2",
"some1thing0",
"some3thing10",
"some3thing2",
"some1thing1",
"some0thing1"]
然后这是代码:
import re
def atoi(text):
return int(text) if text.isdigit() else text
def natural_keys(text):
return [ atoi(c) for c in re.split(r'(\d+)', text) ]
eglist=[
"some0thing3",
"some0thing2",
"some1thing2",
"some1thing0",
"some3thing10",
"some3thing2",
"some1thing1",
"some0thing1"
]
eglist.sort(key=natural_keys)
print(eglist)