我正在开展一个项目,涉及两个与食物相关的数据集之间的映射。一个数据集是法语,另一个是英语。两个数据集都有一个“食物名称”字段,但我法语不流利,并且不希望使用谷歌翻译来完成此任务。我尝试过手动翻译一些食物,但翻译常常不准确,因为食物名称可能具有不易翻译的特定含义。
是否有专门为在法语和英语之间准确翻译食物名称而设计的预先训练的语言模型或工具?任何建议或建议将不胜感激。
谢谢!
有任何关于处理此任务的建议的链接吗?
我认为翻译不好是因为缺乏上下文并且某些术语和短语的含义不明确。
因此,您需要的是一个适合烹饪领域的机器翻译模型,我怀疑您是否会免费找到该模型。您也可以微调自己的此类模型实例,但这需要大量的训练数据。
但即使您使用通用翻译模型,您也可以尝试将上下文注入翻译中。
例如,如果您使用谷歌翻译并希望将烹饪中的“lean”从英语翻译成德语(我不会说法语,所以我将使用德语示例):
输入:
lean
,输出:schlank
--> 错误,因为它翻译为烹饪领域之外的含义
输入:
in the context of cooking, "lean" is defined as...
,输出:Im Zusammenhang mit dem Kochen ist „mager“ definiert als...
--> 正确翻译
如果您使用更高级的模型,例如 ChatGPT,您只需给出考虑上下文的提示,例如
Translate the term lean in the context of cooking
。您可以微调该提示,以确保它仅输出翻译后的术语,而不输出其他内容。
所以我的观点是,只要找到一种方法告诉模型上下文,翻译就会好得多。