我正在使用模板驱动提取来从同一组文档生成SQL视图和RDF三元组。 SQL视图用于快速检查原始数据,而三元组用于下游以将信息提供给知识图。
我现在需要将RDF三元组提取到外部文件中,而我正努力分离出那些支持SQL视图的三元组。该文档建议我应该在Sparql查询中使用固定的主题或谓词,这是我无法做到的,因为我事先都不知道两者。我尝试过滤掉XQuery中的SQL三元组,但是我无法设计一种方法来检测sem:sparql
返回的某个值或cts:triples
返回的三元组是SQL还是我的。
对于从MarkLogic中获取所有非SQL三元组的任何帮助,将不胜感激。
谢谢,汉斯
我正在使用模板驱动提取来从同一组文档生成SQL视图和RDF三元组。 SQL视图用于快速检查原始数据,而使用三元组...
来自SQL视图的主题不是真正的sem:iri(它们是sql:rowID),因此您可以使用以下内容排除它们:
您可以尝试使用功能tde:node-data-extract。它基本上使您可以查看文档和TDE的结果。尽管可能涉及所有文档的某些工作,然后再次将其转换为RDF,但应该可行。