3 回答

TA貢獻(xiàn)1783條經(jīng)驗(yàn) 獲得超4個贊
使用 Counter 獲取頻率,然后按它給出的頻率排序:
from collections import Counter
def sorted_by_frequency(arr):
counts = Counter(arr)
# secondarily sort by value
arr2 = sorted(arr, reverse=True)
# primarily sort by frequency
return sorted(arr2, key=counts.get, reverse=True)
# Usage:
>>> sorted_by_frequency([1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 5, 5, 5, 4, 4, 4, 4, 4, 4])
[4, 4, 4, 4, 4, 4, 3, 3, 3, 3, 3, 5, 5, 5, 2, 2, 2, 1, 1]

TA貢獻(xiàn)1853條經(jīng)驗(yàn) 獲得超6個贊
為什么
sorted(mylist, key=lambda x: (mylist.count, -x), reverse=True)
出錯?
它比較鍵,因此例如兩個值3
和1
成為對(mylist.count, -3)
和 ,(mylist.count, -1)
并且比較將是(mylist.count, -3) < (mylist.count, -1)
。
因此,明顯的錯誤是這些對沒有預(yù)期的數(shù)字頻率。相反,他們有這個功能。而且功能不亞于它本身。
但我發(fā)現(xiàn)注意到當(dāng)時到底發(fā)生了什么很有趣。配對比較是如何進(jìn)行的?您可能認(rèn)為這(a, b) < (c, d)
相當(dāng)于(a < c) or (a == c and b < d)
. 事實(shí)并非如此。因?yàn)檫@會評估mylist.count < mylist.count
,然后你會因TypeError
. 元組相互比較的實(shí)際方式是首先找到差異,然后通過檢查相等性來完成。而且mylist.count == mylist.count
不僅不會崩潰反而會返回True
。因此,元組比較會轉(zhuǎn)到下一個索引,在那里它將找到-3
和-1
。
所以本質(zhì)上你只是在做
sorted(mylist, key=lambda x: -x, reverse=True)
并且否定和reverse=True
相互抵消,所以你得到相同的結(jié)果
sorted(mylist, key=lambda x: x)
要不就
sorted(mylist)
現(xiàn)在如何做對呢?一種方法是調(diào)用該函數(shù)(并刪除否定):
result = sorted(mylist, key=lambda x: (mylist.count(x), x), reverse=True)
或者同時否定頻率和價值,而不是reverse=True
:
result = sorted(mylist, key=lambda x: (-mylist.count(x), -x))
另一種方法是利用排序的穩(wěn)定性并使用兩種更簡單的排序(甚至可能比一種更復(fù)雜的排序更快):
result = sorted(mylist, reverse=True) result.sort(key=mylist.count, reverse=True)
請注意,這里我們不必調(diào)用mylist.count
自己,因?yàn)樗擎I,它將為我們調(diào)用。就像你的“l(fā)ambda 函數(shù)”確實(shí)被調(diào)用一樣(只是不是其結(jié)果中的函數(shù))。另請注意,我使用sorted
后跟就地sort
- 沒有必要創(chuàng)建另一個列表并產(chǎn)生與之相關(guān)的成本。
collections.Counter
盡管在所有情況下,對于長列表,使用 a代替會更有效mylist.count
,因?yàn)楹笳呤菇鉀Q方案采用 O(n 2 ) 而不是 O(n log n)。

TA貢獻(xiàn)1851條經(jīng)驗(yàn) 獲得超3個贊
你可以試試 :
from collections import Counter
counts = Counter(mylist)
new_list = sorted(mylist, key=lambda x: (counts[x], x), reverse=True)
添加回答
舉報