同时处理和聚合多个文件的最佳软件设计方法是什么,每个文件都有大约 200 万条记录

问题描述 投票:0回答:0

我需要同时处理和聚合来自多个文件的数据,每个文件大约有 200 万条记录。我不能使用批处理,因为一个文件的起始行有可能与另一个文件的最后一行匹配,所以我需要一次将所有这些文件保存在内存中。

我正在寻找使用 Java 或 python 或任何其他技术/工具解决此问题的最佳方法。

python java spring-boot architecture software-design
© www.soinside.com 2019 - 2024. All rights reserved.