对多个PDF的翻译语言到英语 我有一组俄语的PDF文件,我需要将它们翻译成英语。我需要自动化此活动。 目前,我将文档上传到Google翻译并进行翻译,但...

问题描述 投票:0回答:2
(注意:我不熟悉翻译文档,但这应该使您的基本体系结构朝着正确的方向)。

基于我们的简短交流,我建议探索这样的过程:

python automation ui-automation power-automate
2个回答
0
投票

,您将使用SharePoint列表托管文档,当添加文档时,电源自动流量会触发并翻译,然后重写文档。您可以使用Microsoft的内部提取和翻译软件(或自动化步骤/操作),也可以向您想要的任何客户端发送HTTP请求。 Google搜索翻译或文本提取API揭示了几种选项,包括Google Translate。

如果您没有任何使用Google Translate(或其他内容)的要求,我个人会坚持使用相同的技术品牌,以便与外部客户合作的头痛更少...但是当然可以取决于任何事情您的要求是。您可以使用“ HTTP”操作启动HTTP请求。

enter image description here

具有自动化功率,您将使用“创建项目时” SharePoint触发器,然后使用Eccodian的“从图像中提取文本”(或根据您的文件类型而不同的内容)。

,然后只需将输出扔到Microsoft转换,或将HTTP请求转换为您想要的任何地方 HTTP Requests


然后,您可以将翻译的输出写入您想要的任何地方,另一个SharePoint列表,数据库,电子邮件等等。

链接 Extract Text from Image MicrosoftTranslator API:

Https://www.microsoft.com/en-us/translator/business/business/translator-api/

Microsoft Translator博客从文档中解释数据:https://powerusers.microsoft.com/t5/power-automate-community-blog/extract-data-data-data-from-documents-with-with-microsoft-flow/ba-p/ba-p/370422 2

使用Python获得此自动化


0
投票

开机PDF

    doc= fitz.open(r'c:\ projects \ trunk ranslator a1.pdf')
  1. 为翻译文本

    创建可选内容组(OCG)
  2. ocg= doc.add_ocg('中文翻译',on = true)
  3. 为文档中的页面: blocks = pag.get_text(“ blocks”,flags = textflags)

    for block in blocks: bbox = block[:4] # Text position (x0, y0, x1, y1) text = block[4] # Extracted text translated_text = to_CH.translate(text) # Translate to Chinese # Remove original text by overlaying a white rectangle page.draw_rect(bbox, color=None, fill=WHITE, oc=ocg) # Insert translated text at the same position page.insert_textbox(bbox, translated_text,fontname="helv", fontsize=10, color=(0, 0, 0), oc=ocg)

    确定字体正确嵌入

    doc.subset_fonts()

    避免翻译的PDF

    doc.save(r'c:\ projects \ trunk ranslator ranslated_chinese.pdf') 打印(“翻译的PDF成功保存!”)'

    你是PDF会翻译

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.