Объединить карту массивов с дубликатами ключей - PullRequest
0 голосов
/ 16 мая 2018

У меня есть две карты массивов.

Map<String, List<String>> map1 = new HashMap<>();
Map<String, List<String>> map2 = new HashMap<>();

Я хочу объединить их в одну новую карту.
Если ключ существует на обеих картах, в этом случае я должен объединить массивы.

Например:

map1.put("k1", Arrays.asList("a0", "a1"));
map1.put("k2", Arrays.asList("b0", "b1"));

map2.put("k2", Arrays.asList("z1", "z2"));

// Expected output is 
Map 3: {k1=[a0, a1], k2=[b0, b1, z1, z2]}

Я пытался сделать это с потоками

Map<String, List<String>> map3 = Stream.of(map1, map2)
    .flatMap(map -> map.entrySet().stream())
    .collect(Collectors.toMap(
        Map.Entry::getKey,
        e -> e.getValue().stream().collect(Collectors.toList())
    ));

Это работает, если на картах нет одинаковых ключей.В противном случае я получаю исключение

Exception in thread "main" java.lang.IllegalStateException: Duplicate key k2 (attempted merging values [b0, b1] and [z1, z2])
    at java.base/java.util.stream.Collectors.duplicateKeyException(Collectors.java:133)
    at java.base/java.util.stream.Collectors.lambda$uniqKeysMapAccumulator$1(Collectors.java:180)
    at java.base/java.util.stream.ReduceOps$3ReducingSink.accept(ReduceOps.java:169)
    at java.base/java.util.HashMap$EntrySpliterator.forEachRemaining(HashMap.java:1751)
    at java.base/java.util.stream.ReferencePipeline$Head.forEach(ReferencePipeline.java:658)
    at java.base/java.util.stream.ReferencePipeline$7$1.accept(ReferencePipeline.java:274)
    at java.base/java.util.Spliterators$ArraySpliterator.forEachRemaining(Spliterators.java:948)
    at java.base/java.util.stream.AbstractPipeline.copyInto(AbstractPipeline.java:484)
    at java.base/java.util.stream.AbstractPipeline.wrapAndCopyInto(AbstractPipeline.java:474)
    at java.base/java.util.stream.ReduceOps$ReduceOp.evaluateSequential(ReduceOps.java:913)
    at java.base/java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:234)
    at java.base/java.util.stream.ReferencePipeline.collect(ReferencePipeline.java:578)
    at im.djm.Test.main(Test.java:25)

Есть ли способ выполнить эту задачу с потоками?
Или я должен перебирать карты?

Ответы [ 8 ]

0 голосов
/ 17 мая 2018

Вот еще один способ объединения карт и списков.

Map<String, List<String>> map3 = Stream.of(map1, map2)
    .flatMap(map -> map.entrySet().stream())
    .collect(Collectors.toMap(
        Map.Entry::getKey,
        Map.Entry::getValue,
        (e1, e2) -> Stream.concat(e1.stream(), e2.stream()).collect(Collectors.toList())
    ));

Третий аргумент в методе toMap:
(e1, e2) -> Stream.concat(e1.stream(), e2.stream()).collect(Collectors.toList()) - это функция mergeFunction.
Эта функция применяется к дубликатам.

Если сопоставленные ключи содержат дубликаты (согласно Object.equals(Object)), функция сопоставления значений применяется к каждому равному элементу, а результаты объединяются с использованием предоставленной функции объединения.
JavaDoc

0 голосов
/ 17 мая 2018

Вот пример использования итерации обеих карт. Первая итерация объединяет общие пары ключ / значение из map1 и map2 и добавляет их в результирующую карту или добавляет уникальные пары ключ / значение в map1 в результирующую карту. Вторая итерация захватывает все остатки в map2, которые не соответствуют map1, и добавляет их в полученную карту.

public static Map<String, ArrayList<String>> joinMaps(Map<String, ArrayList<String>> map1, Map<String, ArrayList<String>> map2)
{
    Map<String, ArrayList<String>> mapJoined = new HashMap<>();

    //join values from map2 into values of map1 or add unique key/values of map1
    for (Map.Entry<String, ArrayList<String>> entry : map1.entrySet()) {
        String key = entry.getKey();
        ArrayList<String> value = entry.getValue();
        if(map2.containsKey(key))
        {
            value.addAll(map2.get(key));
            mapJoined.put(key, value);
        }
        else
            mapJoined.put(key, value);
    }

    //add the non-duplicates left over in map 2
    for (Map.Entry<String, ArrayList<String>> entry : map2.entrySet()) {
        if(!mapJoined.containsKey(entry.getKey()))
            mapJoined.put(entry.getKey(), entry.getValue());
    }

    return mapJoined;
}

Вы также можете добавить набор в функцию, чтобы отслеживать все ключи, добавленные в первой итерации, тогда, если размер этого набора == размер карты2, вы знаете, что карты имеют одинаковые ключи и в этом нет необходимости. перебрать вторую карту, map2.

0 голосов
/ 17 мая 2018

иначе было бы так.

Вы должны начать map3 с карты большего размера (здесь map1).затем используйте цикл над другой картой и используйте метод merge, чтобы объединить дубликат ключа.

Map<String, List<String>> map3 = new HashMap<>(map1);
    for (Map.Entry<String, List<String>> entry : map2.entrySet()) {
       List<String> values = new ArrayList<>(entry.getValue());
       map3.merge(entry.getKey(),entry.getValue(),(l1, l2) -> {values.addAll(l1); 
           return values;
       });
    }

map2.forEach((key, value) -> {
    List<String> values = new ArrayList<>(value);
      map3.merge(key,value, (l1, l2) -> {values.addAll(l1);return values;});
});
0 голосов
/ 16 мая 2018

Вы также можете сделать это так:

Map<String, List<String>> map3 = Stream.concat(map1.entrySet().stream(),
                                               map2.entrySet().stream())
      .collect(Collectors.groupingBy(Entry::getKey,
                   Collectors.mapping(Entry::getValue,
                       Collectors.flatMapping(List::stream,
                           Collectors.toList()))));
0 голосов
/ 16 мая 2018

Использование flatmap дважды

Map<String, List<String>> map1 = new HashMap<>();
Map<String, List<String>> map2 = new HashMap<>();

map1.put("k1", Arrays.asList("a0", "a1"));
map1.put("k2", Arrays.asList("b0", "b1"));

map2.put("k2", Arrays.asList("z1", "z2"));

Map<String, List<String>> map3 = Stream.of(map1, map2)
        .flatMap(p -> p.entrySet().stream())
        .flatMap(p -> p.getValue().stream().map(q -> new Pair<>(p.getKey(), q)))
        .collect(
                Collectors.groupingBy(
                        p -> p.getKey(),
                        Collectors.mapping(p -> p.getValue(), Collectors.toList())
                )
        );

Это работает так:

  • Принимает обе карты Stream<Map<String,List<String>>>
  • FlatMaps записи как Entry<String, List<String>>
  • FlatMaps записи в 1 пару для Pair<String, String>
  • Собирает их по ключу
    • Взяв значения и собирая их в список
0 голосов
/ 16 мая 2018

Вы должны использовать перегруженную версию toMap(), которая позволяет объединять дубликаты ключей:

toMap(Function<? super T, ? extends K> keyMapper,
                                    Function<? super T, ? extends U> valueMapper,
                                    BinaryOperator<U> mergeFunction) 

Вы могли бы написать что-то как:

Map<String, List<String>> map3 = Stream.of(map1, map2)
    .flatMap(map -> map.entrySet().stream())
    .collect(Collectors.toMap(
        Map.Entry::getKey,
        e -> new ArrayList<>(e.getValue()),
        (e1, e2) -> { e1.addAll(e2); return e1;}
    ));
0 голосов
/ 16 мая 2018

Используйте функцию слияния в случае дублирования ключей:

Map<String, List<String>> map3 = Stream.of(map1, map2)
                .flatMap(map -> map.entrySet().stream())
                .collect(Collectors.toMap(
                        Map.Entry::getKey,
                        e -> new ArrayList<>(e.getValue()),
                        (left, right) -> {left.addAll(right); return left;}
                ));

Обратите внимание, я изменил e -> e.getValue().stream().collect(Collectors.toList()) на new ArrayList<>(e.getValue()), чтобы гарантировать, что у нас всегда есть изменяемый список, который мы можем добавить вв функции слияния.

0 голосов
/ 16 мая 2018

Может быть.Но вы, скорее всего, все сделаете правильно, комбинируя записи вручную, используя итерацию.Я не знаю, придется ли кому-то еще работать над этим кодом, но они, вероятно, будут благодарны за удобный для чтения подход.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...