我正在处理二进制流,需要有效地跳过我不感兴趣的一系列数据,以及一些将被处理的数据。
InputStream.skip(long)
在保证方面做得不多:
跳过并丢弃此输入流中的n个字节的数据。由于各种原因,跳过方法可能最终跳过一些较小数量的字节,可能是0.这可能是由许多条件中的任何一个引起的;在跳过n个字节之前到达文件末尾只有一种可能性。返回跳过的实际字节数。
我需要知道发生了两件事之一:
很简单。但是,在此描述中提供的宽大意味着,例如,BufferedInputStream
可以跳过几个字节并返回。当然,它告诉我它只是跳过了那几个,但不清楚为什么。
所以我的问题是:你能以这样的方式使用InputStream.skip(long)
,你知道什么时候流结束或跳过成功?
我认为我们不能得到一个非常强大的实现,因为skip()
方法合同相当奇怪。首先,EOF的行为没有明确定义。如果我想跳过8个字节并且is.skip(8)
返回0,那么判断我是否应该再次尝试并非易事,如果某些实现选择在EOF时返回0,则存在无限循环的危险。 available()
也不值得信赖。
因此,我提出以下建议:
/**
* Skips n bytes.
*/
public static void myskip(InputStream is, long n) throws IOException {
while(n > 0) {
long n1 = is.skip(n);
if( n1 > 0 ) {
n -= n1;
} else if( n1 == 0 ) { // should we retry? lets read one byte
if( is.read() == -1) // EOF
break;
else
n--;
} else // negative? this should never happen but...
throw new IOException("skip() returned a negative value - this should never happen");
}
}
我们不应该返回一个值来通知“真正跳过”的字节数吗?或者是一个布尔值来告知已达到EOF?我们不能以强有力的方式做到这一点。例如,如果我们将skip(8)
称为FileInputStream对象,it will return 8即使我们处于EOF,或者文件只有2个字节。但是该方法在我们想要的意义上是健壮的:跳过n
字节(如果可能的话)并让我继续处理它(如果我的下一次读取返回-1,我将知道已达到EOF)。
这似乎适用于跳过n
字节:
long skippedTotal = 0;
while (skippedTotal != n) {
long skipped = _stream.skip(n - skippedTotal);
assert(skipped >= 0);
skippedTotal += skipped;
if (skipped == 0)
break;
}
boolean skippedEnough = skippedTotal == n;
然而,目前尚不清楚它是否适用于可以传递给我的库的所有InputStream
实现。我想知道实现我自己的缓冲跳过方法是否可行。
这个问题我迟到了6年。
原则上,skip(int n)和readFully(int n)之间没有区别。在跳过的情况下,您对字节不感兴趣。
对于直播,即。 tcp套接字或附加到的文件,skip(n)一旦“跳过”0字节就会阻塞(等待),具体取决于用户的等待时间。
返回EOF或-1表示流的结束,应该返回给最终用户,因为在该点之后不会发生任何其他事情。
为了有效地跳过文件中的字节,我将探索随机io,channel。但是这种优化不能在任何输入流中变得通用。