在Linux + Java服务器中将MS word(.doc,docx)构建为PDF转换服务的最佳选择?

问题描述 投票:0回答:1

似乎有一些相关的帖子,但我没有发现完全相同的内容。因此,我决定发布此新问题。

我在AWS中有一个Windows服务器,该服务器已安装MS Office以执行以下操作:

  • 通过Rest API接收MS word文件的输入流(java tomcat)
  • 触发C#程序以读取MS Word文件
  • Word文件包含一些令牌,例如{{user.name}},{{user.age}}
  • 替换C#程序中的令牌
  • 将最终结果转换为PDF文件
  • 返回PDF文件流

出于以下几点考虑,我正在考虑将此服务转换为Linux + Java程序:

  • Windows服务器的AMI映像未安装MS Office,并且安装花费了太多时间
  • 此服务无法很好地扩展。我已经看到文件进入,并且服务器花费太长时间才能完成令牌替换和转换]
  • 个人偏好:我不是MS服务器/ C#爱好者,但想使用Linux / Java堆栈

有人可以为此需求建议任何高级体系结构吗?预先感谢!

java ms-word pdf-generation
1个回答
0
投票

乍一看,调用C#是有意义的,或者甚至更好的是,我会让word或microft API做到这一点。您甚至无法完全正确地处理单词格式。

对于在Java中读取它的API来说一样,总会有一些东西无法完全处理它。那将是一个巨大的项目。如果它不能独自完成所有操作,那么您将陷入困境。

所以理想情况下,我将完全摆脱单词方面。

我将使用模板格式,然后直接转到pdf部分。可能是您直接使用任意UI创建和存储PDF文件,并将其不同部分直接存储,然后使用Java中的API进行填充。

您可以使用Jaspert Reports之类的东西来生成完整的报告,或者只使用HTML等任何标记语言格式,然后调用适当的API来从中生成PDF。>

另请参见:Creating complex pdf using java

© www.soinside.com 2019 - 2024. All rights reserved.