我有一个由一个巨大的JSON树组成的数据库转储。我想用一个已知的特定密钥提取一个比其余小得多的特定子树。
{ "key1": { subtree1... }, "key2": { subtree2... }, ... }
如何使用流jq提取subtreeN
?
在下文中,我们假设$ key保留了感兴趣的关键。
这里效率的关键是在--stream
选项生成的流处理完成处理$ key密钥后终止。为此,我们可以按如下方式定义辅助函数。请注意,它使用inputs
,因此jq的调用必须使用-n命令行选项。
# break out early
def filter($key):
label $out
| foreach inputs as $in ( null;
if . == null
then if $in[0][0] == $key then $in
else empty
end
elif $in[0][0] != $key then break $out
else $in
end;
select(length==2) );
现在可以按如下方式完成所需键值对的重建:
reduce filter($key) as $in ({};
setpath($in[0]; $in[1]) )
{
"key1": {
"subtree1": {
"a": {"aa":[1,2,3]}
}
},
"key2": {
"subtree2": {
"b1": {"bb":[11,12,13]},
"b2": {"bb":[11,12,13]}
}
},
"key3": {
"subtree3": {
"c": {"cc":[21,22,23]}
}
}
}
jq -n -c --arg key "key2" --stream -f extract.jq input.json
{"key2":{"subtree2":{"b1":{"bb":[11,12,13]},"b2":{"bb":[11,12,13]}}}}