我需要使用 VS2008 开发一个 MS-Word 插件应用程序,将具有内容控件的 docx 文件转换为 iXBRL 格式。 iXBRL 格式是一种相对较新的财务报表标准。
是否有任何 API 可以帮助我,或者任何人都可以给我一个继续进行的想法吗?
我会通过 XSLT 将 OpenXML docx 转换为 XHTML 来实现。
我的 XSLT 会询问“内容控件是否有包含任何特殊指令的标签?”
这样的指令可能是:将此内容控件输出为元素 us-gaap:DebtDisclosureTextBlock
在这种情况下,无论内容控件包含什么,都将包装在该元素中。
如果您采用这种方法,您需要:
一种将 docx 转换为 XHTML 的方法,它作用于内容控制标记中的指令
首先添加内容控制标签的方法(您可以通过 Word 功能区 - 开发人员选项卡执行此操作,但您可能希望为用户提供一种选择适当的 XBRL 元素的方法)
我曾在 IXBRL 工作过,甚至开发过将 doc 转换为 ixbrl 文件的软件。 IXBRL 文件只不过是带有 IXBRL 标签的 Xhtml 文件。(你必须知道这一点)。 软件实际上按照您回答的方式工作。
DOC >>(转换为)XHTML >> 然后使用软件完成标记,使其成为 IXBRL 文件。 后面的过程有点乏味,你需要专门的软件来完成。 该软件需要数年时间才能构建,您需要购买它或自己创建。(就像我们一样)
但是 Mozilla 插件可以帮助您将 Xhtml 转换为 iXBRL 格式。
将文件另存为 html 文件,并在 C# 中使用 XML DOM 编辑标签。但由于我是 C# 新手,我真的不知道如何有效地做到这一点。