Мне нужно добавить несколько миллионов записей данных в базу данных ESE. Среди других значений каждая запись имеет уникальное строковое значение. Это значение можно рассматривать как ключ.
Интересно отметить, что во входном наборе может быть несколько одинаковых экземпляров одной и той же записи. После ввода я хочу только одну запись с каждой из уникальных строк.
Мой вопрос: как это сделать - как быстро отфильтровать дубликаты?
Прямо сейчас я добавляю каждую запись только после поиска ключа, если запись уже существует, я пропускаю ее. Если его нет в базе данных, я добавляю запись и прогресс. Большая цена здесь делает поиск по каждой записи.
есть идеи, как сделать это очень быстро? в любом случае, чтобы ввести значение таким образом, что добавление дубликата не удастся?