卡桑德拉数据建模问题

问题描述 投票:0回答:1

你能帮我在我的表below.I'm这里卡住造型。我的分区键是agent_id和集群列rowid。每个代理可以有一个最低的1000行至10M取决于如何繁忙的代理。我现在面临的大问题划分为我的繁忙坐席。

我使用SizeTieredCompaction这里..表已写入/读取(70/30比例),并有由agent_id也删除表中。

CREATE TABLE IF NOT EXISTS XXX (
 agent_id UUID,
 row_id BIGINT,
 col_a TEXT,
 col_b TEXT,
 col_c TEXT,
 PRIMARY KEY (agent_id,row_id)
)
database cassandra nosql data-modeling datastax
1个回答
1
投票

在C *建模时,此问题出现了很多次。

  1. 如果任一列(col_acol_b等)都有事做的时候,你知道多少(大约)每剂行你要插入的每一天,我会强烈建议year-month-day作为分区键(如果一天就够了,如果没有,请小时或分钟)。
  2. 你可以做一些散列在AGENT_ID + ROW_ID模1M(例如)的。散列可以是分区键,而你做的应用程序,哈希和插入或检索之前。这样,你知道,如果你的估计行量为10M,你的分区都将有大小10。
© www.soinside.com 2019 - 2024. All rights reserved.