DataStax Enterprise是一个大数据平台,由开源工具组成,如Apache Cassandra,Solr和Hadoop(以及其他几个)。
如何在 Spark 和 Cassandra 中将数据从较小的表映射到较大的表? (第一个表的主键是第二个表的分区键)
所以这是我的表1: 案例类别表1( key1: String //(主键), 值1:字符串 ) 表2: 案例类别表2( key1: String //(分区键) key2: String //(主键) ...
随着物化视图的出现 - 是否有可遵循的最佳实践指南? 我读过; http://www.datastax.com/dev/blog/new-in-cassandra-3-0-materialized-views 这似乎是一种敬畏......
使用具有复合唯一键的 Solr 进行深度分页时缺少 nextCursorMark
我正在使用 DataStax Cassandra 和 Solr 卡桑德拉 2.0.10.71 | DSE 4.6.0 | CQL 规范 3.1.1 | Thrift 协议 19.39.0 我有一个 Cassandra 列族: 创建表 kSpace.colfam1 ( 身份证号...
当我执行批处理语句时,我看到未配置的表错误(不一致)。 在批处理语句中,我有几个准备语句(10) 很少有准备语句(其中 2 个)...
如何找出特定 DSE 正在运行哪个版本的 Cassandra?
到目前为止,我还没有在 Datastax 文档网站上找到对此进行总结的地方。我可以通过其他方式在服务器上轻松检查版本吗?
为什么 OpsCenter 存储容量小部件报告的磁盘使用情况与“数据大小”指标不同? [已关闭]
DataStax OpsCenter for Cassandra - 为什么存储容量小部件报告的磁盘使用情况与“数据大小”指标不同? 存储容量小部件显示已使用 38.96 TB,但图表...
Spark Cassandra 连接器:错误 AppendDataExec:数据源写入支持 CassandraBulkWrite
我有一个简单的 Cassandra 表,例如: 创建表 my_keyspace.my_table ( my_composite_pk_a bigint, my_composite_pk_b ascii, 价值斑点, 主键((my_composite_pk_a,
Datastax Cassandra 中 REVOKE 和 RESTRICT 之间的区别
DSE 中的 REVOKE 和 RESTRICT CQLSH 命令有什么区别。 示例:Keyspace Cycling 有 2 个表 - 分别是循环表和兜售表。并且存在一个角色 Jane Jane 被授予 SELECT 权限...
DataStax Opscenter 启动期间出现错误,ImportError
我已经安装了datastax opscenter 6.8,参考:Datastax Docs。但是,opscenter 无法启动,startup.log 文件 (/var/log/opscenter/) 中出现以下错误。 06:42:34 [opcent...
我有一个 Cassandra 表(包含历史数据),大约 5TB 或更多。为了优化基础设施成本,我需要将旧数据卸载到 S3。我正在查看 dsbulk unload,它针对导出进行了优化,但你...
您好,我正在尝试处理 Cassandra 查询,该查询具有数据类型文本的解释字段。我正在使用美元引号字符串来转义特殊字符,但是当我的
cassandra SQL 查询未按 order by | 执行排序在 apache-cassandra SQL 中不起作用
我目前在 xyz 数据库中遇到查询问题。当我尝试执行查询时 select * from table where x='data' order bycreated_at desc 允许过滤, 我收到了
在哪里可以找到有关哪个版本的 Cassandra 支持哪个版本的 SSTables 的更多信息。 最近我注意到 DSE Cassandra 正在生成 SSTables bti,而 Apache Cassandra 3.11.4 继续...
DataStax Enterprise 中无法启动 cassandra(单节点场景)
我正在尝试使用 DataStax Enterprise 在单节点上设置 cassandra(这仅适用于在非生产服务器上实验性使用 DataStax Enterprise)。 我正在使用亚马逊图像,它是 rhel b...
如何在多应用场景下获得Cassandra Writes的背压?
我有多个应用程序写入 Cassandra。 每个单元应用程序都配置了反压机制,例如吞吐量MBPerSec = 10 当多个应用程序同时运行时就会出现问题
如何在 DSE 中配置 Spark 作业服务器以对作业进行排队直至资源可用?
我们使用的是 DataStax Enterprise,它支持 Spark 和 Spark Job 服务器。 我们有3个节点的olap casandra集群,每个节点配置8核处理器和32G RAM 就我们的sp...
在升级 cassandra Apache 或 DSE 期间,是否建议删除现有的自定义索引或二级索引。我们可以在不删除索引的情况下继续升级吗?如果我们不放弃可以...
我在使用 cassandra 的 ruby 中插入查询时遇到问题, 这是我的桌子: 创建表 testkeyspace.ticket ( id 整数, uid 文本, 环形布尔值, 避免十进制, 凯斯在...
我正在使用 Datastax 6.8。这是我的 SOLR 架构: 我正在使用 Datastax 6.8。这是我的 SOLR 架构: <?xml version="1.0" encoding="UTF-8" standalone="no"?> <schema name="autoSolrSchema" version="1.5"> <types> <fieldType class="org.apache.solr.schema.StrField" name="StrField"/> <fieldType class="org.apache.solr.schema.TextField" name="NameField"> <analyzer type="index"> <filter class="solr.ASCIIFoldingFilterFactory"/> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> </fieldType> </types> <fields> <field indexed="true" multiValued="false" name="nama" type="StrField"/> <field indexed="true" multiValued="false" name="nama_copy" type="NameField"/> </fields> <uniqueKey>(nama)</uniqueKey> <copyField dest="nama_copy" source="nama"/> </schema> 我连续有这个字段值batamindo v 然后我运行了这个查询 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ v 我得到了非常好的结果 { "responseHeader":{ "status":0, "QTime":8}, "response":{"numFound":579,"start":0,"docs":[ { "nama":"BATAMINDO V "}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}] }} 但是当我跑步时 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ vi 我的搜索结果非常糟糕 { "responseHeader":{ "status":0, "QTime":14}, "response":{"numFound":602,"start":0,"docs":[ { "nama":"MV. VINCA"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINCENT TRADER"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"NAVI SUNNY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MT. GOLDEN VIOLET"}, { "nama":"MT. GOLDEN VIOLET"}] }} 这里发生了什么? 您所看到的是预期行为。 NGramFilterFactory类将字符串标记为N大小的克。在您的情况下,字符串根据您的架构定义被分成 2 到 15 个字符的克: <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> 对于像 cassandra 这样的输入字符串,N 元语法过滤器会生成以下语法: 大小=2:ca as ss sa an nd dr ra 大小=3:cas ass ssa san and ndr dra 大小=4:cass assa ssan sand andr ndra 依此类推,直到大小=15 对于搜索词 ss,Solr 查询将获得 ss、ass、ssa、assa、ssan 等的匹配项。 在您的搜索词为 vi 的情况下,预计会匹配 vinca、vinaship、vincent、victory、navi、violet 等。 有关更多信息,请参阅Solr 中的文档分析。干杯!
我可以将Apache cassandra节点添加到DataStax (DSE) cassandra集群中吗?
我正在从Datastax (DSE) Cassandra迁移到Apache Cassandra 3.11。我有一个由7个节点组成的Datastax(DSE)Cassandra集群。有什么方法可以让我创建新的集群的apache ...