github页面的引用不是很清楚
Fairseq(-py) 是一个序列建模工具包,允许研究人员 和开发人员训练用于翻译、摘要的自定义模型, 语言建模和其他文本生成任务。
和
fairseq2 是一个序列建模工具包,允许研究人员和 开发人员训练自定义模型以进行翻译、摘要、 语言建模和其他内容生成任务。这也是 fairseq 的继承者。
到目前为止,我意识到存在
API
更改(例如,从检查点加载模型),以及添加新的多模式,例如Seamless communication
,
但为什么要放弃一个完善的框架并从头开始呢?
引用 Can Balioglu(FAIR 研究工程师)的评论,这是 fairseq 存储库问题 #4493 中的讨论的一部分
我们想让您知道,FAIR 将很快启动 fairseq v2 项目,以实现我们的代码库现代化并解决 fairseq 长期存在的结构和技术问题。我们 Fairseq 的高级目标是:请注意,fairseq2 的版本可通过
拥有干净、可维护、经过良好测试的代码库,利用 PyTorch 及其生态系统的最新功能。
请注意,虽然我们的目标是将它们保持在最低限度,但为了实现我们的一些目标,我们将进行向后不兼容的更改,主要是在我们的训练器和数据加载 API 中。除了这些变化之外,我们还计划提供大量可扩展性 API,以减轻大多数用例中 fork/branch fairseq 的需要。- 保留原fairseq多年来积累的性能优化。
- 通过定义良好的 API 强制用户代码与库代码分离,以便它既可以用作框架也可以用作库。
- 为习惯原始 fairseq 的研究人员提供熟悉的界面。
- 配备新的容错功能和工具,用于大规模训练和推理。
fairseq2 版本页面 获得。某些版本提供了更改日志,表明(可能)发生重大更改,尤其是早期版本。