最近我正在编写一些微基准代码,所以我必须打印出JVM行为以及我的基准信息。我用
-XX:+PrintCompilation
-XX:+PrintGCDetails
以及获取JVM状态的其他选项。对于基准信息,我只使用System.out.print()
方法。因为我需要知道我打印的消息的顺序和JVM输出。
当我在控制台中打印它们时,我可以获得良好的结果,尽管JVM输出有时会撕掉我的消息,但由于它们处于不同的线程中,因此它是可以理解和可接受的。
当我需要做一些批处理基准时,我想用redirect the output into a file
和pipe (> in Linux system)
,并使用python从文件中获取结果并进行分析。
这是问题所在:
The JVM output always overlapped with the messages I printed in the Java application.
它破坏了消息的完成。
知道如何应对这种情况吗?我需要both the JVM output and application output in the same place in order to preserve the sequence because it is important. And they do not overlap on each other so I don't lose anything.
我建议稍微绕道一下,看看使用Java Instrumentation API - 使用(编写)一个简单的Java代理来完成这项工作。从您的基准测试角度来看,这也将为您提供更多功能。您可以使用Java代理记录所有内容(因此不同的记录器线程之间不会发生争用)。
您可以在http://www.javabeat.net/2012/06/introduction-to-java-agents/或http://today.java.net/pub/a/today/2008/04/24/add-logging-at-class-load-time-with-instrumentation.html上阅读更多内容
尝试使用qazxsw poi而不是qazxsw poi。 qazxsw poi强制同步部分内的流冲洗,至少你的输出不会混合。
使用Log4J或消息驱动的日志框架与System.out.println()
。
Log4J使用消息事件模型来保证消息的排序。此外,各种“appenders”可用于登录数据库或其他输出/文件,允许通过Java包和其他属性进行分离,因此数据不会混合。
此外,沿着这些思路,考虑使用高性能计时器和/或不要尝试测量非常短(毫秒)的事件。原因是对System.out.print()
的调用将依次调用操作系统时钟。在每个OS上都存在一些“时钟漂移”和缓存,使得底层系统功能可以返回相同的值,从而在实际时间内产生+/- 30ms的偏移。要解决此问题或提高准确性,请将测量的函数分组为足够大的样本大小,然后除以迭代次数。
例如,执行10K操作,平均1-2毫秒作为一个测量操作。然后除以10K以获得每次操作的时间。
否则,再次需要高性能计时器。
通过System.out.print / println直接记录被认为是不好的做法。
为什么?
2000年,引入了Log4J。 它解决了所有这些问题,从那以后一直是标准的解决方案。虽然有一些最新和最好的日志工具试图超越Log4J,但您仍然可以使用Log4J获得强大而灵活的结果。如果您将所有System.out.print调用切换到Log4J,那么您引用的问题和许多其他问题将消失。
System.out.println()
对于System.out.println()
,您可以使用System.currentTimeMillis()
标志来在单独的“hotspot.log”文件中获取“详细”输出。此文件采用XML格式,包含来自http://logging.apache.org/log4j/1.2/manual.html的信息以及此类编译的原因。文件路径可以通过-XX:+PrintCompilation
更改。参考:-XX:+UnlockDiagnosticVMOptions -XX:+LogCompilation
对于-XX:+PrintCompilation
,您可以使用-XX:LogFile=<new_hotspot_log>
将GC输出重定向到指定的文件。参考:https://wiki.openjdk.java.net/display/HotSpot/LogCompilation+overview
我建议尝试以下方法。这更像是一个黑客,需要一些修修补补。但掌握这种方法可能会带来长期回报。特别是,如果你做了很多基准测试。
说我很肯定HS(现在,Oracle)应该有一个选项将编译器输出重定向到一个文件。你只需要很难找到它:-) HS应该有一个选项来打印出他们所有的JVM和编译器选项,其中可能是将输出重定向到文件的选项。
无论如何,我离题了......
1)$ JAVA_HOME或%JAVA_HOME%中应该有src.zip。它包含Java类库的源代码。
2)修改System.out以将所有输出重定向到特定的失败,或者只是让它插入一些特殊符号,您可以在其上捕获stdout和stderr。遗憾的是,由于我们公司的政策禁止我们检查src.zip的内容,因此我不能更具体地说明这一特定步骤。我只能想象这一步会有多困难。也许与输出流交换“out”或者修改应用程序直接使用的每种打印方法一样困难。我甚至不知道System.out使用了多少本机
3)将编译后的版本放在jar文件中。
4)将此选项添加到命令行:-Xbootclasspath / p:full_path_to_your_jar这将告诉JVM首先使用您的类的版本。 “P”代表前置。
希望这有助于......
首先,我会尝试@barracel关于使用System.out.println()的注意事项。
我对Java知之甚少,但您也可以将所有调试消息写入stderr并将stdout留给JVM。这可以防止当多个线程写入同一文件描述符时明显发生的stdout污染。
尝试拆分JVM和您的应用程序的输出。
所以,命令行是这样的:
-XX:+PrintGCDetails
要以非重叠方式输出,请使用System.out.println。然后你可以像这样重定向到同一个文件:
-Xloggc:<gc_log>
这有文件名stdout.txt中的所有错误以及正常的控制台输出
此外,如果日志具有任何形式的线程/时间信息,您可以简单地使用
java -X
其中-k 1代表您有线程/数据(纪元)信息的列。