почему неупорядоченный набор смешивает значения - PullRequest
0 голосов
/ 27 февраля 2019

Я пытаюсь удалить дубликаты из вектора с помощью unordered_set.но мой дизайн создает unordered_set, который не поддерживает порядок правильно.в этом примере «z» не в конце.Что я делаю неправильно?заранее спасибо.

РЕДАКТИРОВАТЬ: извините, если я не был ясен с тем, что я искал.Я хочу, чтобы вывод был "e, d, a, b, c, z". Я хочу сохранить исходный порядок, но удалить дубликаты.В настоящее время он работает, используя около 3 различных циклов for и дополнительную копию вектора инициализации.Я просто искал функцию STL, которая была бы более чистой, если это возможно.

результат: edabcaaaabbbbcz печать неупорядоченного набора edazbc

#include <iostream> 
#include <iterator>     
#include <algorithm>    
#include <string>
#include <unordered_set>
using namespace std;

int main() {
    vector<string>terminals = { "e", "d", "a", "b", "c", "a", "a", "a", "a", "b","b", "b", "b", "c", "z" };
    for (vector<string>::iterator it = terminals.begin(); it != terminals.end(); it++) // print given vector
        cout << *it << " ";
    cout << endl;
    unordered_set<string> newSet;
    copy(terminals.begin(), terminals.end(), inserter(newSet, newSet.end()));
    cout << "printing unordered set" << endl;
    for (unordered_set<string>::iterator it = newSet.begin(); it != newSet.end(); it++)
        cout << *it << " ";
    cout << endl;
    //system("pause");
    return 0;
}

Ответы [ 5 ]

0 голосов
/ 27 февраля 2019

Я пытаюсь удалить дубликаты из вектора с помощью unordered_set.

Почему вы предполагаете, что unordered_set сохраняет любой порядок?В названии четко указано, что какого-либо конкретного заказа нет.

Вы должны использовать unordered_set только для отслеживания, если элемент уже был найден в последовательности.Исходя из этого, вы можете удалить элемент из последовательности, поэтому это должно выглядеть следующим образом:

void removeDuplicates(Data &data)
{
    std::unordered_set<std::string> foundItems;
    auto newEnd = std::remove_if(data.begin(), data.end(), [&foundItems](const auto &s)
                                 {
                                     return !foundItems.insert(s).second;
                                 });
    data.erase(newEnd, data.end());
}

https://wandbox.org/permlink/T24UfiLQep0XUQhQ

0 голосов
/ 27 февраля 2019

std :: unordered_set :

Внутренне, элементы не отсортированы в каком-либо конкретном порядке , но организованы в сегменты.В какую корзину помещается элемент, полностью зависит от хеша его значения.Это обеспечивает быстрый доступ к отдельным элементам, так как после вычисления хеша это относится к точному сегменту, в который помещен элемент.

Если вам нужно заказать уникальные терминалы, используйте std :: set :

#include <iostream>
#include <vector>
#include <string>
#include <set>

int main() {
    std::vector<std::string>terminals = { "e", "d", "a", "b", "c", "a", "a", "a", "a", "b","b", "b", "b", "c", "z" };

    for(const std::string& terminal : terminals) // print given vector
        std::cout << terminal << " ";
    std::cout << "\n";;

    // populate the set directly from the vectors iterators:
    std::set<std::string> newSet(terminals.begin(), terminals.end());;

    std::cout << "printing the (ordered) set:" << "\n";;
    for(const std::string& terminal : newSet)
        std::cout << terminal << " ";
    std::cout << "\n";;
}

Если вы хотите сохранить оригинальный порядок, вы не можете использовать ни один из них в качестве конечного хранилища, но вы можете использоватьstd::unordered_set в качестве кэша / черного списка для значений, которые вы уже вставили в окончательное хранилище.

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <unordered_set>

int main() {
    std::vector<std::string>terminals = { "e", "d", "a", "b", "c", "a", "a", "a", "a", "b","b", "b", "b", "c", "z" };

    for(const std::string& terminal : terminals) // print given vector
        std::cout << terminal << " ";
    std::cout << "\n";;

    std::vector<std::string> newSet; // not really a set anymore
    std::unordered_set<std::string> cache; // blacklist

    // try to insert all terminals and only when an insert is successful,
    // put the terminal in newSet

    std::for_each(terminals.begin(), terminals.end(),
        [&](const std::string& terminal) {
            auto [it, inserted] = cache.insert(terminal);
            if(inserted)
                newSet.push_back(terminal);
        }
    );

    std::cout << "printing the vector of unique terminals:" << "\n";;
    for(const std::string& terminal : newSet)
        std::cout << terminal << " ";
    std::cout << "\n";;
}

Если вы хотите, чтобы исходный заказ и не возражал вносить изменения непосредственно вИсходный вектор terminals, вы можете использовать std::remove_if в сочетании с unordered_set, что приятно, поскольку для него не требуется новый вектор.Это аннотированный вариант ответа @Marek R:

Прочтите это сначала: Стереть-удалить идиому

int main() {
    std::vector<std::string>terminals = { "e", "d", "a", "b", "c", "a", "a", "a", "a", "b","b", "b", "b", "c", "z" };

    for(const std::string& terminal : terminals) // print given vector
        std::cout << terminal << " ";
    std::cout << "\n";;

    std::unordered_set<std::string> cache; // blacklist

    // remove_if() moves all entries in your container, for which the
    // UnaryPredicate(*) returns true, to the end of the container. It returns
    // an iterator pointing to the first element in the vector that was
    // moved - which is a suitable starting point for a subsequent erase().
    //
    // (*) UnaryPredicate: A callable that returns true or false given a single
    //                     value.

    // auto past_new_end = std::vector<std::string>::iterator past_new_end
    auto past_new_end = std::remove_if(terminals.begin(), terminals.end(),
        // this lambda is the UnaryPredicate
        [&](const std::string& terminal) {
            // insert returns a std::pair<Iterator, bool>
            // where the bool (.second in the pair) is false
            // if the value was not inserted (=it was already present)
            return cache.insert(terminal).second == false;
        }
    );

    std::cout << "display all the entries (now with unspecified values) "
                 "that will be erased:\n";
    std::copy(past_new_end, terminals.end(),
                            std::ostream_iterator<std::string>(std::cout, "<"));
    std::cout << "\n";

    // erase all the moved entries
    terminals.erase(past_new_end, terminals.end());

    std::cout << "printing the unique terminals:" << "\n";;
    for(const std::string& terminal : terminals)
        std::cout << terminal << " ";
    std::cout << "\n";;
}
0 голосов
/ 27 февраля 2019

Если вы хотите сохранить исходный порядок, но обеспечить уникальность, вы, вероятно, захотите:

  1. прочитать в элементе.
  2. Попробуйте вставить его в набор
  3. если это удастся, его ранее не было в наборе, поэтому также скопируйте его на выход
  4. Repeat

Если вы хотите упорядочить выходы (поэтому, вНапример, вывод будет "abcdez"), тогда вы можете либо вставить элементы в std::set, либо вы можете использовать std::sort, а затем std::unique, чтобы получить ровно один из каждого уникального элемента на входе.

0 голосов
/ 27 февраля 2019

Вы также можете использовать неупорядоченную карту , а затем сохранить элемент как ключ к карте и индекс как соответствующее значение этого ключа.

0 голосов
/ 27 февраля 2019

Похоже, вы хотите использовать (упорядоченный) набор .

Редактировать: Похоже, что вы на самом деле нет.std::vector может работать, но это, вероятно, не самый чистый обходной путь.

...