在求和/添加其他值时按唯一值分组

问题描述 投票:2回答:4

我有一个如下所示的数据结构:

arr = [
  {
    price: 2.0,
    unit: "meter",
    tariff_code: "4901.99",
    amount: 200
   },
   {
    price: 2.0,
    unit: "meter",
    tariff_code: "4901.99",
    amount: 200
   },
   {
    price: 14.0,
    unit: "yards",
    tariff_code: "6006.24",
    amount: 500
   },
   {
    price: 14.0,
    unit: "yards",
    tariff_code: "6006.24",
    amount: 500
  }
]

我需要通过tariff_code对所有这些进行分组,同时总结与该关税代码相对应的价格和金额。所以我的预期输出应该是:

[
  {
    price: 4.0,
    unit: "meter",
    tariff_code: "4901.99",
    amount: 400
   },
   {
    price: 2.0,
    unit: "yards",
    tariff_code: "6006.24",
    amount: 1000
   }
]

receipt_data[:order_items].group_by { |oi| oi[:tariff_code] }.values

上面使用的group_by语句将允许我按关税代码进行分组,但我无法找出一种方法来对其他值求和。我确信有一种光滑的单行方式来实现这一目标......

ruby-on-rails ruby hash group-by sum
4个回答
2
投票

更详细:

grouped_items = arr.group_by { |oi| oi[:tariff_code] }
result = grouped_items.map do |tariff_code, code_items|
  price, amount = code_items.reduce([0, 0]) do |(price, amount), ci|
    [price + ci[:price], amount + ci[:amount]]
  end
  {
    price:       price,
    unit:        code_items.first[:unit],
    tariff_code: tariff_code,
    amount:      amount
  }
end
#[
#  {:price=>4.0, :unit=>"meter", :tariff_code=>"4901.99", :amount=>400}
#  {:price=>28.0, :unit=>"yards", :tariff_code=>"6006.24", :amount=>1000}
#]

2
投票

只是为了增加乐趣,使用group_by作为@cary的答案说,并且主要是复制Pavel的答案。这在性能上非常差,仅在数组很小时使用。它还使用仅在Rails中可用的sum。 (可以用纯红宝石中的.map { |item| item[:price] }.reduce(:+)代替)

arr.group_by { |a| a[:tariff_code] }.map do |tariff_code, items|
  {
    price: items.sum { |item| item[:price] },
    unit: items.first[:unit],
    tariff_code: tariff_code,
    amount: items.sum { |item| item[:amount] }
  }
end

如果它是一个对象数组(可能是ActiveRecord对象),而不是哈希值,那么它本来会更小。

arr.group_by(&:tariff_code).map do |tariff_code, items|
  {
    price: items.sum(&:price]),
    unit: items.first[:unit],
    tariff_code: tariff_code,
    amount: items.sum(&:amount)
  }
end

2
投票

解决此类问题有两种标准方法。我采用的一种方法是使用Hash#update(aka merge!)的形式,它使用一个块来确定两个哈希中合并的键的值。另一种方式是使用Enumerable#group_by,我希望有人很快会在另一个答案中使用。我不认为这两种方法在效率或可读性方面都是优选的。

arr.each_with_object({}) do |g,h|
  h.update(g[:tariff_code]=>g) do |_,o,n|
    { price: o[:price]+n[:price], unit: o[:unit], amount: o[:amount]+n[:amount] }
  end
end.values
  #=> [{:price=>4.0,  :unit=>"meter", :amount=>400},
  #    {:price=>28.0, :unit=>"yards", :amount=>1000}] 

请注意,values的接收器被视为:

{"4901.99"=>{:price=>4.0,  :unit=>"meter", :amount=>400},
{"6006.24"=>{:price=>28.0, :unit=>"yards", :amount=>1000}} 

1
投票

一种简单的方法,但它很容易添加用于求和和更改组密钥的新密钥。不确定效率,但500_000倍arr.map的基准看起来不错

#<Benchmark::Tms:0x00007fad0911b418 @label="", @real=1.480799000000843, @cstime=0.0, @cutime=0.0, @stime=0.0017340000000000133, @utime=1.4783359999999999, @total=1.48007>

summ_keys = %i[price amount]
grouping_key = :tariff_code
result = Hash.new { |h, k| h[k] = {} }
arr.map do |h|
  cumulative = result[h[grouping_key]]
  h.each do |k, v|
    case k
    when *summ_keys
      cumulative[k] = (cumulative[k] || 0) + h[k]
    else
      cumulative[k] = v
    end
  end
end
p result.values

# [{:price=>4.0, :unit=>"meter", :tariff_code=>"4901.99", :amount=>400},
#  {:price=>28.0, :unit=>"yards", :tariff_code=>"6006.24", :amount=>1000}]
© www.soinside.com 2019 - 2024. All rights reserved.