为字典中的每个密钥对（n0，a），（n0，b）的最大值获取密钥对（n0，_），（n1，_）

Question

假设我们有一个像这样的字典：

os_stats = {
    ('USA', 'Mac OS X'): 1,
    ('Mexico', 'iOS'): 3,
    ('USA', 'Windows XP'): 2, 
    ('Germany', 'Windows 7'): 9,
    ('Germany', 'Windows XP'): 7, 
    ('Mexico', 'Windows XP'): 2,
    ...
}

我想要一个输出，如：

os_preferences = {
     ('Mexico', 'iOS'): 3, 
     ('USA', 'Windows XP'): 2,
     ('Germany', 'Windows 7'): 9, 
      ...
}

只提供每个国家的最高价值。我怎样才能做到这一点？

Answer 1

这个词汇理解是这样的：

{country:{os:count} for (country,os),count in sorted(os_stats.items(), key=lambda rec:rec[1])}

第一部分是这样的：

sorted(os_stats.items(), key=lambda rec:rec[1])

这产生：

[(('USA', 'Mac OS X'), 1),
 (('Mexico', 'Windows XP'), 2),
 (('USA', 'Windows XP'), 2),
 (('Mexico', 'iOS'), 3),
 (('Germany', 'Windows XP'), 7),
 (('Germany', 'Windows 7'), 9)]

请注意，它按计数字段（rec[1]）的升序排序。

其余的只是将数据按摩到单个dict中，这样可以通过覆盖较小的值来丢弃较小的值，因为它与较大的值一起使用。

Answer 2

pandas通过3行完成工作：

import pandas as pd
df = pd.DataFrame(os_stats, index=['index']).transpose()
os_preferences = df[df['index'] == df.groupby(level=[0])['index'].transform(max)].to_dict()['index']

# output:
# {('Mexico', 'iOS'): 3, 
#  ('USA', 'Windows XP'): 2, 
#  ('Germany', 'Windows 7'): 9}

为字典中的每个密钥对（n0，a），（n0，b）的最大值获取密钥对（n0，_），（n1，_）

问题描述投票：1回答：2

2个回答

最新问题

为字典中的每个密钥对（n0，a），（n0，b）的最大值获取密钥对（n0，_），（n1，_）

问题描述 投票：1回答：2

2个回答

最新问题

问题描述投票：1回答：2