Самый простой способ перебрать Multiset в порядке частоты элемента? - PullRequest
32 голосов
/ 03 декабря 2010

Рассмотрим этот пример, который выводит статистику некоторых типов устройств. («DeviceType» - это перечисление с десятками значений.)

Multiset<DeviceType> histogram = getDeviceStats();
for (DeviceType type : histogram.elementSet()) {
    System.out.println(type + ": " + histogram.count(type));
}

Какой самый простой и элегантный способ печати отдельных элементов в порядке их частоты (сначала самый распространенный тип)?

При быстром взгляде на интерфейс Multiset готового метода для этого не существует, и ни одна из реализаций Multiset в Guava (HashMultiset, TreeMultiset и т. Д.), Похоже, автоматически сохраняйте упорядоченные по частоте элементы либо.

Ответы [ 4 ]

39 голосов
/ 28 сентября 2011

Я только что добавил эту функцию в Guava, см. здесь для Javadoc.

Редактировать : пример использования Multisets.copyHighestCountFirst() согласно исходному вопросу:

Multiset<DeviceType> histogram = getDeviceStats();
for (DeviceType type : Multisets.copyHighestCountFirst(histogram).elementSet()) {
    System.out.println(type + ": " + histogram.count(type));
}
7 голосов
/ 03 декабря 2010

Вот метод, который возвращает List записей, отсортированных по частоте ( UPDATE : используется флаг для переключения по возрастанию / убыванию и используется любимая игрушка Гуавы: Enum Singleton Pattern, как показано в Эффективная Java , пункт 3):

private enum EntryComp implements Comparator<Multiset.Entry<?>>{
    DESCENDING{
        @Override
        public int compare(final Entry<?> a, final Entry<?> b){
            return Ints.compare(b.getCount(), a.getCount());
        }
    },
    ASCENDING{
        @Override
        public int compare(final Entry<?> a, final Entry<?> b){
            return Ints.compare(a.getCount(), b.getCount());
        }
    },
}

public static <E> List<Entry<E>> getEntriesSortedByFrequency(
    final Multiset<E> ms, final boolean ascending){
    final List<Entry<E>> entryList = Lists.newArrayList(ms.entrySet());
    Collections.sort(entryList, ascending
        ? EntryComp.ASCENDING
        : EntryComp.DESCENDING);
    return entryList;
}

Код теста:

final Multiset<String> ms =
    HashMultiset.create(Arrays.asList(
        "One",
        "Two", "Two",
        "Three", "Three", "Three",
        "Four", "Four", "Four", "Four"
    ));

System.out.println("ascending:");
for(final Entry<String> entry : getEntriesSortedByFrequency(ms, true)){
    System.out.println(MessageFormat.format("{0} ({1})",
        entry.getElement(), entry.getCount()));
}

System.out.println("descending:");
for(final Entry<String> entry : getEntriesSortedByFrequency(ms, false)){
    System.out.println(MessageFormat.format("{0} ({1})",
        entry.getElement(), entry.getCount()));
}

Выход:

восходящая:
Один (1)
Два (2)
Три (3)
Четыре (4)
по убыванию:
Четыре (4)
Три (3)
Два (2)
Один (1)

3 голосов
/ 07 декабря 2010

Реализация, использующая ForwardingMultiSet :

( EntryComp от seanizer's ответ )

enum EntryComp implements Comparator<Multiset.Entry<?>> {
    DESCENDING {
        @Override
        public int compare(final Entry<?> a, final Entry<?> b) {
            return Ints.compare(b.getCount(), a.getCount());
        }
    },
    ASCENDING {
        @Override
        public int compare(final Entry<?> a, final Entry<?> b) {
            return Ints.compare(a.getCount(), b.getCount());
        }
    },
}

public class FreqSortMultiSet<E> extends ForwardingMultiset<E> {
    Multiset<E> delegate;
    EntryComp comp;

    public FreqSortMultiSet(Multiset<E> delegate, boolean ascending) {
        this.delegate = delegate;
        if (ascending)
            this.comp = EntryComp.ASCENDING;
        else
            this.comp = EntryComp.DESCENDING;
    }

    @Override
    protected Multiset<E> delegate() {
        return delegate;
    }

    @Override
    public Set<Entry<E>> entrySet() {
        TreeSet<Entry<E>> sortedEntrySet = new TreeSet<Entry<E>>(comp);
        sortedEntrySet.addAll(delegate.entrySet());
        return sortedEntrySet;
    }

    @Override
    public Set<E> elementSet() {
        Set<E> sortedEntrySet = new LinkedHashSet<E>();
        for (Entry<E> en : entrySet())
            sortedEntrySet.add(en.getElement());
        return sortedEntrySet;
    }

    public static <E> FreqSortMultiSet<E> create(boolean ascending) {
        return new FreqSortMultiSet<E>(HashMultiset.<E> create(), ascending);
    }

    /*
     * For Testing
     * public static void main(String[] args) {
        Multiset<String> s = FreqSortMultiSet.create(false);
        s.add("Hello");
        s.add("Hello");
        s.setCount("World", 3);
        s.setCount("Bye", 5);
        System.out.println(s.entrySet());
    }*/

}
2 голосов
/ 03 декабря 2010

Поскольку это еще не реализовано , я думаю, вы можете создать Map с ключом = типом и значением = счетчиком. Затем отсортируйте эту карту - см. здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...