我正在审计两个交易系统之间的一些财务数据。这两个数据集由交易列表组成。每个都有,
数据不完善; 10-20% 的数据不一致。
我已经使用 Pandas 拼凑出了一个解决方案:有什么更有效的方法可以根据条件逐行合并 DataFrame 中的行?。 简单的
pandas.merge()
过于贪婪,会产生许多错误的匹配。良好的匹配取决于数据集中的多个标准。
使用 Pandas 有哪些替代方案? 当我研究这个问题时,我发现一些 Pandas 答案建议了一些操作,这让我担心数据丢失或重复。
将其转化为更好的 Stackoverflow 问题的形式:有哪些流行的算法或数据结构可用于匹配两个独立系统之间的活动?
调整金融异步系统涉及处理可能未实时同步的数据。多种算法和数据结构可用于此目的:
时间戳和事件源:
分布式账本技术(DLT)/区块链:
共识算法:
消息队列:
哈希函数:
默克尔树:
矢量时钟:
无冲突复制数据类型 (CRDT):
最终一致性模型:
基于增量的复制:
因果一致性模型:
时间序列数据库:
这些算法和数据结构有助于管理跨异步系统协调财务数据的复杂性,确保金融交易和流程的一致性、可靠性和安全性。 查看更多