如何在java中对字符串集合进行分块

问题描述 投票:0回答:2

我有一个 String 类型的集合,其中包含 0 到 10k 值。 我正在寻找一种优雅或可重用的方法来编写一种方法,该方法接受 String 类型的集合和批处理大小,并将集合拆分为所提供的批处理大小的较小块。

我能想到的最好的解决方案是:

private static <T> Collection<Collection<T>> getBatches( List<T> collection, int batchSize ){
        return IntStream.iterate(0, i -> i < collection.size(), i -> i + batchSize)
                .mapToObj(i -> collection.subList(i, Math.min(i + batchSize, collection.size())))
                .collect(Collectors.toList());
    }

一些担忧:

  1. 我想接受 String 类型的集合并返回 String 类型的集合的集合或 String 类型的集合的列表。
  2. 我想知道是否有任何缺点或边缘情况该逻辑不起作用。
java collections chunks
2个回答
1
投票

看看这个示例想法:

  final List<Integer> numbers = Arrays.asList(1,2,3,4,5,6,7);
  final int chunkSize = 3;
  final AtomicInteger counter = new AtomicInteger();

  final Collection<List<Integer>> result = numbers.stream()
              .collect(Collectors.groupingBy(it -> 
                             counter.getAndIncrement() / chunkSize))
     .values();

  System.out.println(result);

0
投票

您可以根据您的具体要求使用Guava

Lists.partition
和tweek

static <T> List<List<T>> partition(List<T> list, int size)
返回列表的连续子列表,每个子列表的大小相同(最终列表可能更小)。

如下例所示

@Test 
public void givenList_whenParitioningIntoNSublists_thenCorrect() {
    List<Integer> intList = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8);
    List<List<Integer>> subSets = Lists.partition(intList, 3);

    List<Integer> lastPartition = subSets.get(2);
    List<Integer> expectedLastPartition = Lists.<Integer> newArrayList(7, 8);

    assertThat(subSets.size(), equalTo(3));
    assertThat(lastPartition, equalTo(expectedLastPartition));
}

更多详情:

https://guava.dev/releases/23.3-jre/api/docs/com/google/common/collect/Lists.html#partition-java.util.List-int-

https://www.baeldung.com/java-list-split

© www.soinside.com 2019 - 2024. All rights reserved.