我目前正在 Watson discovery 中使用直方图功能,但我需要为每个切片提供文档,以便我可以再次对它们进行处理。 (例如查看平均情绪)
这是我的查询,它将我的数据分解为 15 分钟的块
filter(enriched_tweet.concepts.text:"'Hockey'").histogram(extracted_metadata.utc_timestamp,interval:900000)
但响应仅告诉我每个“切片”中有多少个文档。
{
"matching_results": 444530,
"aggregations": [
{
"type": "filter",
"match": "enriched_tweet.concepts.text:\"'Hockey'\"",
"matching_results": 69556,
"aggregations": [
{
"type": "histogram",
"field": "utc_timestamp",
"interval": 900000,
"results": [
{
"key": 1498227300000,
"matching_results": 180
},
{
"key": 1498228200000,
"matching_results": 258
},
扩展以下答案
因此,即使您在结果中没有看到存储桶中的数据,您也可以对它们执行操作,例如,以下操作将起作用:
filter(enriched_tweet.concepts.text:"'Hockey'").histogram(utc_timestamp,interval:900000).sum(followers)
我想要的是每个切片的一组文档,这样我就可以检查它们并对它们进行求和,以计算出例如 15 分钟间隔的情绪。
您可以运行嵌套在直方图聚合下的求和聚合,该聚合可以对直方图存储桶内的字段进行求和。有关聚合的更多信息,请参阅 https://www.ibm.com/watson/developercloud/doc/discovery/query-reference.html#aggregations。