Question

У меня есть двумерный вектор целочисленного типа, который содержит большое количество векторов (т.е. 18000 и выше), и в этом пуле имеется значительное количество повторяющихся векторов. Я хочу обнаружить похожие векторы и удалить один из них. В настоящее время я сравниваю каждый вектор со всем пулом, используя следующую функцию: `

bool compareVectors(vector<int> a, vector<int> b)
{
    if (a.size() != b.size())
    {
        return false;
    }
    sort(a.begin(), a.end());
    sort(b.begin(), b.end());
    return (a == b);
}

Но это неэффективно делает процесс, вероятно, из-за большого количества сравнений, которые я делаю. Есть ли возможные эффективные способы сделать это?

Goswin von Brederlow · Answer 1 · 30 апреля 2018

Подготовка:

Сначала рассортируйте ваши векторы по ведрам в соответствии с размером.
Контейнеры с одним вектором означают, что вектор является уникальным, выводится и удаляется.
сортировка всех оставшихся векторов в оставшихся сегментах

начать с i = 0

Рекурсивный алгоритм:

для каждого ведра:

сортирует векторы в сегменты в соответствии с v. (I)
Buckets только с одним вектором означает, что вектор уникален, выведите и удалите
входить в каждое ведро с i = i + 1

Davis Herring · Answer 2 · 30 апреля 2018

Создайте set или unordered_set из канонизированных (здесь, отсортированных) версий ваших (под) векторов. Затем вы можете найти все дубликаты за O ( mn log m log n ) времени, где m и n - внешние и внутренние измерения ваших данных соответственно.

Возможно, вы захотите использовать отображение, скажем, для хранения индекса первого представителя каждого класса эквивалентности. Вы можете использовать reserve для удаления журнала m из времени выполнения unordered_set.

сравнивая векторы в большом наборе данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

сравнивая векторы в большом наборе данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы