我试图找出TDB2构建的索引。我通过代码发现它使用B +树将它们存储在光盘上,但我没有得到它们包含的内容以及它们的使用方式。
所以我的详细问题是:
如果你能指点我的白皮书或类似TDB2的软件设计,它也会对我有所帮助。我搜索它但找不到任何东西。
TDB2对每个RDF术语都有一个“id”(文字的URI,空白节点)。 id是固定长度64.另一种说法是保留字典。
对于三元组,它保留了SPO,POS和OSP(这是可配置的,但这是默认设置)。三元组作为那些ID存储在索引中 - 因此每个三元组有3个ID。固定长度。
默认情况下,索引是堆外部的内存映射文件。它们提供了良好的可用性。
这是当前的默认设置。代码隔离了例如64位ID可能更长,不同的索引选择。