В книге Скиены "Руководство по разработке алгоритмов" вычисление режима (наиболее частый элемент) набора, как говорят, имеет Ω ( n log * 1005). * n ) нижняя граница (это озадачивает меня), но также (правильно я предполагаю), что для вычисления режима не существует более быстрого алгоритма наихудшего случая. Меня озадачивает только нижняя граница Ω ( n log n ).
См. Страницу книги в Google Книгах
Но, безусловно, в некоторых случаях это можно рассчитать за линейное время (наилучший случай), например, с помощью кода Java, как показано ниже (находит наиболее часто встречающийся символ в строке), «хитрость» заключается в подсчете вхождений с использованием хеш-таблицы. Это кажется очевидным.
Итак, что мне не хватает в моем понимании проблемы?
РЕДАКТИРОВАТЬ: (загадка разгадана). Как указывает StriplingWarrior, нижняя граница сохраняется, если используются только сравнения, т.е. нет индексации памяти, см. Также: http://en.wikipedia.org/wiki/Element_distinctness_problem
// Linear time
char computeMode(String input) {
// initialize currentMode to first char
char[] chars = input.toCharArray();
char currentMode = chars[0];
int currentModeCount = 0;
HashMap<Character, Integer> counts = new HashMap<Character, Integer>();
for(char character : chars) {
int count = putget(counts, character); // occurences so far
// test whether character should be the new currentMode
if(count > currentModeCount) {
currentMode = character;
currentModeCount = count; // also save the count
}
}
return currentMode;
}
// Constant time
int putget(HashMap<Character, Integer> map, char character) {
if(!map.containsKey(character)) {
// if character not seen before, initialize to zero
map.put(character, 0);
}
// increment
int newValue = map.get(character) + 1;
map.put(character, newValue);
return newValue;
}