我有一个 String 类型的集合,其中包含 0 到 10k 值。 我正在寻找一种优雅或可重用的方法来编写一种方法,该方法接受 String 类型的集合和批处理大小,并将集合拆分为所提供的批处理大小的较小块。
我能想到的最好的解决方案是:
private static <T> Collection<Collection<T>> getBatches( List<T> collection, int batchSize ){
return IntStream.iterate(0, i -> i < collection.size(), i -> i + batchSize)
.mapToObj(i -> collection.subList(i, Math.min(i + batchSize, collection.size())))
.collect(Collectors.toList());
}
一些担忧:
看看这个示例想法:
final List<Integer> numbers = Arrays.asList(1,2,3,4,5,6,7);
final int chunkSize = 3;
final AtomicInteger counter = new AtomicInteger();
final Collection<List<Integer>> result = numbers.stream()
.collect(Collectors.groupingBy(it ->
counter.getAndIncrement() / chunkSize))
.values();
System.out.println(result);
您可以根据您的具体要求使用Guava
Lists.partition
和tweek
返回列表的连续子列表,每个子列表的大小相同(最终列表可能更小)。static <T> List<List<T>> partition(List<T> list, int size)
如下例所示
@Test
public void givenList_whenParitioningIntoNSublists_thenCorrect() {
List<Integer> intList = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8);
List<List<Integer>> subSets = Lists.partition(intList, 3);
List<Integer> lastPartition = subSets.get(2);
List<Integer> expectedLastPartition = Lists.<Integer> newArrayList(7, 8);
assertThat(subSets.size(), equalTo(3));
assertThat(lastPartition, equalTo(expectedLastPartition));
}
更多详情: