带有溢出和 Alluxio 缓存的 Trino 向对象存储发出大量请求

问题描述 投票:0回答:1

grafana minio requests counters

我有 Trino、Hive Metastore 和 Minio 存储的本地设置。我已经在 Trino 上启用并配置了 Alluxio 缓存和磁盘溢出。对对象存储发出的请求数量高于预期。鉴于我只测试几兆字节的 Parquet 文件。

可能是什么问题?以及解决方案?

这是我在 /etc/trino/config.properties 中的配置。

coordinator=true
node-scheduler.include-coordinator=true
http-server.http.port=8080
discovery.uri=http://localhost:8080
catalog.management=${ENV:CATALOG_MANAGEMENT}
query.max-memory=2GB
query.max-memory-per-node=700MB
exchange.http-client.max-requests-queued-per-destination=999999
scheduler.http-client.max-requests-queued-per-destination=999999
exchange.http-client.request-timeout=30s
task.info-update-interval=2s
spill-enabled=true
spiller-spill-path=/tmp/spill
spiller-max-used-space-threshold=0.7
spiller-threads= 16
max-spill-per-node=100GB
query-max-spill-per-node=100GB
aggregation-operator-unspill-memory-limit=15MB
spill-compression-codec=LZ4
spill-encryption-enabled=false

这是我在 /etc/trino/catalog/hive.properties 中的目录配置

connector.name=hive
hive.metastore=thrift
hive.metastore.uri=thrift://hive-metastore:9083
hive.s3.path-style-access=true
hive.s3.endpoint=http://minio:9000
hive.s3.aws-access-key=XXX
hive.s3.aws-secret-key=XXX
hive.non-managed-table-writes-enabled=true
hive.s3.ssl.enabled=false
hive.s3.max-connections=1000
hive.metastore.thrift.client.read-timeout=3000s
hive.timestamp-precision=MILLISECONDS
hive.collect-column-statistics-on-write=false
hive.storage-format=PARQUET
hive.security=allow-all
fs.cache.enabled=true
fs.cache.directories=/tmp/cache
fs.cache.max-disk-usage-percentages=70
fs.cache.ttl=32d
fs.cache.preferred-hosts-count=5
fs.cache.page-size=15MB

提前致谢。

hive parquet minio trino alluxio
1个回答
0
投票

我建议初学者不要混合溢出和文件系统缓存,它们并不是设计来一起工作的。除此之外,我想说这完全取决于您的查询是什么、它们必须访问哪些数据、您的文件和分区的结构以及您如何定义“预期”。所以现阶段我真的无法回答更多细节。

© www.soinside.com 2019 - 2024. All rights reserved.