Question

vs2005 поддержка :: stdext :: hash_map :: станд :: карта.

однако кажется, что вставка и удаление OP: stdext :: hash_map медленнее, чем :: std :: map в моем тесте. (менее 10000 наименований)

Интересно ....

Может кто-нибудь предлагал сравнить статью о них?

Steve Jessop · Answer 1 · 14 июля 2009

Обычно вы смотрите на сложности различных операций, и это хорошее руководство: амортизированная O (1) вставка, O (1) поиск, удаление для хэш-карты по сравнению с O (log N), вставка, поиск, удаление для древовидная карта.

Однако, есть определенные ситуации, в которых сложности вводят в заблуждение, поскольку постоянные термины являются экстремальными. Например, предположим, что ваши 10 тыс. Элементов являются ключевыми. Предположим далее, что каждая строка имеет длину 100 000 символов. Предположим, что разные строки обычно отличаются в начале строки (например, если они по существу случайные, пары будут отличаться в первом байте с вероятностью 255/256).

Затем, чтобы выполнить поиск, хэш-карта должна хешировать строку 100 КБ. Это O (1) в размере коллекции, но может занять довольно много времени, так как это, вероятно, O (M) в длине строки. Сбалансированное дерево должно выполнять сравнение log N <= 14, но каждое из них должно рассматривать только несколько байтов. Это может занять совсем немного времени. </p>

С точки зрения доступа к памяти, с размером строки в 64 байта кеша, хэш-карта загружает более 1500 последовательных строк и выполняет 100-килобайтовые операции, тогда как дерево загружает 15 случайных строк (на самом деле, вероятно, 30 из-за косвенного обращения через строку) и выполняет 14 * (некоторое небольшое количество) байтовых операций. Вы можете видеть, что первое вполне может быть медленнее, чем второе. Или это может быть быстрее: насколько хороши пропускная способность FSB вашей архитектуры, время задержки и спекулятивное кэширование чтения?

Если поиск находит совпадение, то, конечно, в дополнение к этому обеим структурам необходимо выполнить одно сравнение строк во всю длину. Также hashmap может выполнить дополнительные неудачные сравнения, если в корзине произошла коллизия.

Если предположить, что неудачные сравнения настолько быстры, что их можно пренебречь, в то время как успешные сравнения и операции хэширования выполняются медленно, дерево может быть примерно в 1,5-2 раза быстрее, чем хеш. Если эти предположения не верны, то не будет.

Конечно, крайний пример, но довольно легко увидеть, что в ваших данных конкретная операция O (log N) может быть значительно быстрее, чем конкретная операция O (1). Вы, конечно, правы, желая провести тестирование, но если ваши тестовые данные не являются репрезентативными для реального мира, то результаты вашего теста также могут быть не репрезентативными. Сравнения структур данных, основанных на сложности, относятся к поведению в пределе, когда N приближается к бесконечности. Но N не приближается к бесконечности. Это 10000.

ovanes · Answer 2 · 14 июля 2009

Это не просто вставка и удаление. Вы должны учитывать, что память выделяется по-разному в зависимости от карты hash_map и вам каждый раз приходится вычислять хэш искомого значения.

Я думаю, что эта статья Dr.Dobbs лучше всего ответит на ваш вопрос:

Хэш-контейнеры C ++ STL и производительность

Diaa Sami · Answer 3 · 14 июля 2009

hash_map использует хеш-таблицу , которая предлагает операции O (1) с почти постоянным временем при условии хорошей хеш-функции.

map использует BST , предлагает операции O (lg (n)), для 10000 элементов это 13, что очень приемлемо

Я бы сказал, оставайся с картой, это безопаснее.

polyglot · Answer 4 · 14 июля 2009

Это зависит от вашего использования и коллизий хешей. Один - это двоичное дерево, а другой - хеш-таблица.

В идеале хэш-карта должна иметь O (1) вставку и поиск, а также карту O (ln n), но она предполагает не конфликтующие хэши.

Narendra N · Answer 5 · 14 июля 2009

Карта хеша создаст хеш строки / ключа для индексации. Хотя при доказательстве сложности он упоминается как O (1), hash_map выполняет обнаружение коллизий для каждой вставки, поскольку хеш строки может давать тот же индекс, что и хеш другой строки. Следовательно, хэш-карта имеет сложность для управления этими коллизиями, и вы знаете, что эти коллизии основаны на входных данных.

Однако, если вы собираетесь выполнить много проверок структуры, выберите hash_map.

Miguel A. Friginal · Answer 6 · 14 июля 2009

Хеш-таблицы должны быть быстрее, чем двоичные деревья (например, std :: map) для поиска. Никто никогда не предполагал, что они быстрее для вставки и удаления.

hash_map и карта, которая быстрее? менее 10000 наименований

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

hash_map и карта, которая быстрее? менее 10000 наименований

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы