RegEx用于从XML字符串匹配CDATA

Question

我的xml字符串是：

    String neMsg= "<root>" 
              +"   <CONTENT>"
              +"                <![CDATA[00000:<ResponseClass Name=\"Response\"><ITEM>HAHA</ITEM></ResponseClass>]]>"
              +"        </CONTENT>"
              +"</root>";

我试过用四种方法编写代码，但仍然无法获取内容。我该如何解决这个问题？

 //java.util.regex.Pattern pP0=java.util.regex.Pattern.compile("<!\\[CDATA\\[00000:(\\s|\\S)*?\\]\\]>");
     // java.util.regex.Pattern pP0=java.util.regex.Pattern.compile("<!\\[CDATA\\[00000:(.*)\\]\\]>");
     // java.util.regex.Pattern pP0=java.util.regex.Pattern.compile("<CONTENT>(.*)<!\\[CDATA\\[(.*)\\]\\]>(.*)</CONTENT>");
     Pattern pP0 = Pattern.compile(".*<!\\[CDATA\\[00000:(.*)\\]\\]>.*");
    java.util.regex.Matcher mP0= pP0.matcher(neMsg);
      System.out.println(mP0.group(1));

Answer 1

你永远不应该用正则表达式解析HTML，而是可以使用像JSoup这样的HTML解析器。

这里的问题是，你需要首先调用matcherObject.find()（用于在字符串中的任何位置查找模式）或matcherObject.matches()（使用此用于匹配整个字符串与模式）方法，然后才能访问匹配，并且您应该首先通过使用find或matches循环检查if或while的值是否为真。你还需要调用group(1)而不是group(0)（这将返回整个匹配）来访问group1中的内容。

将您的代码更改为此，

String neMsg = "<root>" + "   <CONTENT>"
        + "                <![CDATA[00000:<ResponseClass Name=\"Response\"><ITEM>HAHA</ITEM></ResponseClass>]]>"
        + "        </CONTENT>" + "</root>";

Pattern pP0 = Pattern.compile(".*<!\\[CDATA\\[00000:(.*)\\]\\]>.*");
java.util.regex.Matcher mP0 = pP0.matcher(neMsg);
if (mP0.find()) { // matches method will also work because your pattern is wrapped with `.*` from both sides
    System.out.println(mP0.group(1));
}

打印整场比赛，

<ResponseClass Name="Response"><ITEM>HAHA</ITEM></ResponseClass>

RegEx用于从XML字符串匹配CDATA

问题描述投票：-1回答：1

1个回答

最新问题

RegEx用于从XML字符串匹配CDATA

问题描述 投票：-1回答：1

1个回答

最新问题

问题描述投票：-1回答：1