我正在使用DaizyDIff库来比较两个html文件。我写了一个java代码来实现DaizyDiff。但是在运行时我在net.sf.saxon.event.ReceivingContentHandler.startElement上得到NULL指针异常
我在SAXTransformerFactory上尝试了多种方法,但我无法弄清楚
public static void daisyDiffTest() throws Exception {
String html1 = "<html><body>var v2</body></html>";
String html2 = "<html> \n <body> \n Hello world \n </body> \n </html>";
try {
StringWriter finalResult = new StringWriter();
SAXTransformerFactory tf = (SAXTransformerFactory) SAXTransformerFactory.newInstance();
TransformerHandler result = tf.newTransformerHandler();
result.getTransformer().setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
result.getTransformer().setOutputProperty(OutputKeys.INDENT, "yes");
result.getTransformer().setOutputProperty(OutputKeys.METHOD, "html");
result.getTransformer().setOutputProperty(OutputKeys.ENCODING, "UTF-8");
result.setResult(new StreamResult(finalResult));
ContentHandler postProcess = result;
Locale val = Locale.ENGLISH;
DaisyDiff.diffHTML(new InputSource(new StringReader(html1)), new InputSource(new StringReader(html2)),
postProcess, "test", val);
System.out.println(finalResult.toString());
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
HTML文件中的预期结果会有所不同。
如果不知道DaisyDiff是什么,或者是什么叫它,它很难知道。它很可能没有经过测试或支持与Saxon一起使用。
传递给SAX ContentHandler中的startElement()事件的数据格式取决于XML解析器的配置选项,以及以这种方式将Saxon作为ContentHandler调用时的问题是它无法发现哪些配置选项解析器正在使用。
正如Javadoc文档中所述:http://www.saxonica.com/documentation/index.html#!javadoc/net.sf.saxon.event/ReceivingContentHandler@startElement如果解析器发出的事件与适当配置的解析器发出的事件不对应,则ReceivingContentHandler将以不可预测的方式失败。
发布异常的堆栈跟踪可能很有用。