删除之间任何东西的最佳方法和在HTML或TXT中

Question

我在2000个文件中有2GB文件的HTML文件我发现将以下内容应用于所有内容的最佳方法：

1）删除<rt>和</rt>之间的任何内容

2）删除<rt>, </rt>, <ruby>, </ruby>

这是输入和输出的示例

输入：

<ruby>
    <span class="kobospan" id="calibre_link-78">唐</span>
    <rt>
        <span class="kobospan" id="calibre_link-79">とう</span>
    </rt>
    <span class="kobospan" id="calibre_link-80">突</span>
    <rt>
        <span class="kobospan" id="calibre_link-81">とつ</span>
    </rt>
</ruby>
<span class="kobospan" id="calibre_link-82"></span>

输出：

<span class="kobospan" id="calibre_link-78">唐</span>
<span class="kobospan" id="calibre_link-80">突</span>
<span class="kobospan" id="calibre_link-82"></span>

我正在寻找的最理想的解决方案是.bat文件，我可以直接拖入内容并使其应用更改。

最不理想的解决方案是带有命令代码的程序，我可以通过单击自动应用所有更改。

至少，我希望能够逐个手动完成。

Answer 1

由于已经有两个星期而你没有得到任何答案，我可以为你提供这个解决方案，即使它不是理想的方法：

在Notepad ++中打开一个文件并执行正则表达式查找和替换：

找到什么：</?ruby>\s+?^|<rt>.*?</rt>\s+?^

不要在“替换为”框中单击任何内容，然后单击“全部替换”。

确保您已选择“正则表达式”搜索模式，并选中“.match newline”框。

删除之间任何东西的最佳方法和在HTML或TXT中

问题描述投票：0回答：1

1个回答

最新问题

删除之间任何东西的最佳方法 和 在HTML或TXT中

问题描述 投票：0回答：1

1个回答

最新问题

删除之间任何东西的最佳方法和在HTML或TXT中

问题描述投票：0回答：1