我在管道中设置了几个数据质量测试,并使用 dbt test 来执行它们。目前,使用
elementary
和 dbt_expectations
包,我还可以将测试结果加载到雪花表上。所有详细信息(node_id、数据库、模式、test_name、严重性…)都作为记录记录到表中。
但是为了深入研究数据质量问题,我想识别测试用例失败的记录。我目前没有看到任何包或宏可以帮助我获取失败案例的行。
我应该遵循什么方法?
我将使用 dbt 文档中的参数 store-result: https://docs.getdbt.com/reference/data-test-configs
在 dbt_project.yml 中: 测试: : +store_failures:true
您将在表格中获得导致测试出错的所有值。 然后你需要编写一些 SQL 来找出它们属于哪一行。