Как насчет преобразования слова "need" в строку "d1e2n1" вместо использования словаря в качестве ключа? Чтобы построить эту строку, вы можете использовать двоичное дерево. Символ будет использоваться в качестве ключа и количество символов в качестве значения. Двоичное дерево автоматически сортируется по ключу, что не относится к словарю.
Вы можете вычислить объединенное значение хеш-функции из отдельных значений хеш-функции, комбинируя их двоичное представление с операцией XOR. С C # вы бы сделали что-то вроде этого:
public override int GetHashCode()
{
// Combine hashcode of a and b
return a.GetHashCode() ^ b.GetHashCode();
}
Поиск записи в несортированном списке является операцией O (n). Поиск записи в отсортированном списке является операцией O (log (n)), если используется двоичный поиск.
Поиск слова в списке в словаре - это операция O (1 + n), которая аналогична операции O (n) или операции O (1 + log (n)), которая является такой же, как операция O (log (n)).
EDIT:
Вот возможная реализация:
var anagrams = new Dictionary<string, List<string>>();
foreach (string word in words) {
string key = GetFrequency(word);
List<string> list;
if (anagrams.TryGetValue(key, out list)) {
list.Add(word);
} else {
list = new List<string> { word };
anagrams.Add(key, list);
}
}
Он использует этот метод для получения ключа:
private string GetFrequency(string word)
{
var dict = new SortedDictionary<char, int>(); // Implemented as binary tree
foreach (char c in word.ToLower()) {
int count;
if (dict.TryGetValue(c, out count)) {
dict[c] += 1;
} else {
dict[c] = 1;
}
}
return dict.Aggregate(new StringBuilder(), (sb, item) => sb.Append(item.Key).Append(item.Value), sb => sb.ToString());
}
Используя это определение для слов ...
var words = new List<string> { "need", "eden", "team", "meat", "meta", "Nat", "tan" };
Этот тест ...
foreach (var item in anagrams.OrderBy(x => x.Key)) {
Console.WriteLine();
Console.WriteLine(item.Key + ":");
foreach (string word in item.Value.OrderBy(w => w)) {
Console.WriteLine(" " + word);
}
}
... производит этот вывод
a1e1m1t1:
meat
meta
team
a1n1t1:
Nat
tan
d1e2n1:
eden
need
РЕДАКТИРОВАНИЕ № 2:
Вот расчет частоты, предложенный Беном Фойгтом
private string GetFrequencyByBenVoigt(string word)
{
char[] chars = word.ToLower().ToCharArray();
Array.Sort(chars);
return new string(chars);
}
Результат теста будет
aemt:
meat
meta
team
ant:
Nat
tan
deen:
eden
need