我目前正在开展一个项目,需要将客户评论从 AWS 上的源语言翻译成英语。使用 AWS Translate 很容易做到这一点,但在调用翻译 API 将文本翻译成英语之前,我想检查 AWS 是否支持源语言? 一种解决方案是将 AWS Translate 支持的所有语言代码放入一个列表中,然后根据该列表检查源语言。这很简单,但会很混乱,我想让它更有活力。 所以,我想像这样编码
import boto3
def translateUserComment(source_language):
translate = boto3.client(service_name='translate', region_name='region', use_ssl=True)
languages_supported = tanslate.<SomeMethod>()
if source_language in languages_supported:
result = translate.translate_text(Text="Hello, World",
SourceLanguageCode=source_language, TargetLanguageCode="en")
print('TranslatedText: ' + result.get('TranslatedText'))
print('SourceLanguageCode: ' + result.get('SourceLanguageCode'))
print('TargetLanguageCode: ' + result.get('TargetLanguageCode'))
else:
print("The source language is not supported by AWS Translate")
问题是我无法找到任何 API 调用来获取 AWS Translate 支持的语言/语言代码列表。 在我发布这个问题之前,
任何建议/重定向到正确的方法都将受到高度赞赏。
目前没有用于此服务的 API,尽管此代码可以工作,但在此代码中创建了一个包含所有语言代码和国家/地区的类 Translate_lang 从这里 -> https://docs.aws.amazon.com/translate/latest/dg/what-is.html ,您可以在程序中调用此类并通过创建该类的实例来使用它:
translate_lang_check.py
class Translate_lang:
def __init__(self):
self.t_lang = {'Afrikaans': 'af', 'Albanian': 'sq', 'Amharic': 'am',
'Arabic': 'ar', 'Armenian': 'hy', 'Azerbaijani': 'az',
'Bengali': 'bn', 'Bosnian': 'bs', 'Bulgarian': 'bg',
'Catalan': 'ca', 'Chinese (Simplified)': 'zh',
'Chinese (Traditional)': 'zh-TW', 'Croatian': 'hr',
'Czech': 'cs', 'Danish': 'da ', 'Dari': 'fa-AF',
'Dutch': 'nl ', 'English': 'en', 'Estonian': 'et',
'Farsi (Persian)': 'fa', 'Filipino Tagalog': 'tl',
'Finnish': 'fi', 'French': 'fr', 'French (Canada)': 'fr-CA',
'Georgian': 'ka', 'German': 'de', 'Greek': 'el', 'Gujarati': 'gu',
'Haitian Creole': 'ht', 'Hausa': 'ha', 'Hebrew': 'he ', 'Hindi': 'hi',
'Hungarian': 'hu', 'Icelandic': 'is', 'Indonesian': 'id ', 'Italian': 'it',
'Japanese': 'ja', 'Kannada': 'kn', 'Kazakh': 'kk', 'Korean': 'ko',
'Latvian': 'lv', 'Lithuanian': 'lt', 'Macedonian': 'mk', 'Malay': 'ms',
'Malayalam': 'ml', 'Maltese': 'mt', 'Mongolian': 'mn', 'Norwegian': 'no',
'Persian': 'fa', 'Pashto': 'ps', 'Polish': 'pl', 'Portuguese': 'pt',
'Romanian': 'ro', 'Russian': 'ru', 'Serbian': 'sr', 'Sinhala': 'si',
'Slovak': 'sk', 'Slovenian': 'sl', 'Somali': 'so', 'Spanish': 'es',
'Spanish (Mexico)': 'es-MX', 'Swahili': 'sw', 'Swedish': 'sv',
'Tagalog': 'tl', 'Tamil': 'ta', 'Telugu': 'te', 'Thai': 'th',
'Turkish': 'tr', 'Ukrainian': 'uk', 'Urdu': 'ur', 'Uzbek': 'uz',
'Vietnamese': 'vi', 'Welsh': 'cy'}
def check_lang_in_translate(self, given_country):
if given_country in self.t_lang:
return self.t_lang[given_country]
else:
return None
def check_lang_code_in_translate(self, given_lang):
if given_lang in list(self.t_lang.values()):
return True
else:
return False
您可以使用此类的方法来调用和检查您的语言代码:
from translate_lang_check import Translate_lang
tl = Translate_lang()
print(tl.check_lang_code_in_translate('en'))
https://docs.aws.amazon.com/translate/latest/APIReference/API_ListLanguages.html
我使用它(在函数内部)就像
try:
log.info("Fetching languages from AWS Translate")
client = translator_client_aws
response = client.list_languages(DisplayLanguageCode="en")
return response["Languages"]
except (BotoCoreError, ClientError) as error:
msg = f"An error occurred: {error}"
log.error(msg)
raise
返回类似的内容
{
│ 'Languages': [
│ │ {
│ │ │ 'LanguageName': 'Afrikaans',
│ │ │ 'LanguageCode': 'af'
│ │ },
│ │ {
│ │ │ 'LanguageName': 'Albanian',
│ │ │ 'LanguageCode': 'sq'
│ │ },
│ │ {
│ │ │ 'LanguageName': 'Amharic',
│ │ │ 'LanguageCode': 'am'
│ │ },
│ │ {'LanguageName': 'Arabic', 'LanguageCode': 'ar'},
│ │ {
│ │ │ 'LanguageName': 'Armenian',
│ │ │ 'LanguageCode': 'hy'
│ │ },
...
如您所见 https://docs.aws.amazon.com/translate/latest/dg/what-is-languages.html
它说
Amazon Translate supports text translation between the languages listed in the following table.
换句话说,他们也使用目标语言作为源语言。
我用下面的示例对其进行了测试,以确保它有效。
注意:
translate_text_aws
是我自己的包装器(非公开),但你明白了。
t="Tengo jugo de manzana."
translate_text_aws(text=t,source="es-mx",target="es") # To Spanish (Spain)
# 'Tengo zumo de manzana.'
t="Tengo zumo de pera."
translate_text_aws(text=t,source="es",target="es-mx") # To Spanish (Mexico)
# 'Tengo jugo de pera.'