jq：如何为大型流媒体用例自定义atomize函数？

Question

我有一个非常大的文件，具有以下结构：

{ 
  "users": { ... },
  ...
  "stats": {
    "daily": {
      "k1": { ... },
      "k2": { ... },
      ...
      "kN": { ... }
    },
    "monthly": {
      "p1": { ... },
      "p2": { ... },
      ...
      "pN": { ... }
    }
  }
}

在stats中只有两个键：daily和monthly，它们都包含大量的键值对。

我想分别在.stats.daily和.stats.monthly中流式传输所有键值对。如果文件很小，我只需要做jq '.stats.daily' myfile.json和jq '.stats.monthly' myfile.json

我无法弄清楚如何编辑烹饪书中的atomize功能，以便做我想要的。这是我正在尝试的不起作用：

jq -nc --stream '
  def atomize(s):
    fromstream(foreach s as $in ( {previous:null, emit: null};
      if ($in | length == 2) and ($in|.[0][0]) != .previous and .previous != null
      then {emit: [[.previous]], previous: $in|.[0][0]}
      else { previous: ($in|.[0][0]), emit: null}
      end;
      (.emit // empty), $in) ) ;
  atomize(2|truncate_stream(inputs | select(.[0][0] == "daily"))

有人可以解释它是如何工作的以及如何为我的用例修复它？谢谢

Answer 1

既然您已经表明要与“月”值分开处理“每日”值，那么让我们关注前者。

为此，让我们开始只使用fromstream和truncate_stream：

输入如给出的示例，但调整为有效的JSON：

fromstream( 1|truncate_stream(1|truncate_stream(
  inputs | select( .[0][0] == "stats" and .[0][1] == "daily" ) )) )

会产生：

{"k1":{"a":[1]},"k2":{"a":[1]},"kN":{"a":[1]}}

如果你有jq 1.6，那么上面的jq过滤器可以简化为：

fromstream(2|truncate_stream(
  inputs | select( .[0][0:2] == ["stats","daily"] ) ))

现在我们只需使用atomize而不是fromstream来获得所需的结果。例如，使用jq 1.6，我们看到：

atomize(2|truncate_stream(
  inputs | select( .[0][0:2] == ["stats","daily"] ) ))

会产生：

{"k1":{"a":[1]}}
{"k2":{"a":[1]}}
{"kN":{"a":[1]}}

调用

jq -n -c --stream -f program.jq input.json

提高效率

假设输入中的对象没有重复的键，可以简化上述解决方案，以便一旦处理了感兴趣的键，就不再进行进一步的处理。这可以使用如下定义的run/3来实现。流媒体解决方案然后变为：

atomize( 1 | truncate_stream( 1 | truncate_stream(
  run( inputs; .[0][0:2]; ["stats", "daily"] ))))

或者使用jq 1.6：

atomize( 2 | truncate_stream(
  run( inputs; .[0][0:2]; ["stats", "daily"] )))

`run/3`

# emit the first run of items in the stream for which f == $value
def run(stream; f; $value):
  label $done
  | foreach stream as $x ( {};
      ($x | f) as $k
      | if .start then (if $k == $value then . else .stop = true end)
        elif $k == $value then .start = true
        else .
        end;
      if .stop then break $done 
      elif .start then $x
      else empty
      end );

jq：如何为大型流媒体用例自定义atomize函数？

问题描述投票：1回答：1

1个回答

调用

提高效率

`run/3`

最新问题

jq：如何为大型流媒体用例自定义atomize函数？

问题描述 投票：1回答：1

1个回答

调用

提高效率

run/3

最新问题

问题描述投票：1回答：1

`run/3`