我的组织希望我减少对 Talend 的依赖,并使用 Python/PySpark 等开源软件来执行 ETL 作业。目前,已经使用了数百个 Talend Job,我被分配使用 Python/PySpark 将它们全部转换。
我来这里是为了获得关于要记住什么、所涉及的挑战、关于最佳实践的任何有用的提示和建议以及如何以足智多谋和及时的方式实现这一点的一般建议。
感谢您的所有建议。