У меня есть набор текстовых файлов, которые я импортирую в SQL Server через SqBulkCopy в C #. Есть несколько записей, которые появляются в нескольких записях, и я хотел бы пропустить их, а не выдавать ошибку и останавливаться.
В тех случаях, когда есть четкий уникальный ключ / первичный ключ, все хорошо - я использовал «WITH (IGNORE_DUP_KEY = ON)» с хорошим эффектом.
В этом случае, однако, такой уникальный идентификатор не может быть определен, за исключением объединения ВСЕХ полей или создания составного ключа, включающего все поля. Я пытался получить уникальный ID транзакции или подобное, но ни один не доступен. Иногда записи совпадают, но одна цифра в поле изменилась; в этом случае я хочу вставить его в таблицу.
Я полагаю, что может быть лучший подход, чем создание ключа для всех полей? Если бы я сделал это, это означало бы, что даты, строки, значения и т. Д. Должны были бы быть смешаны для формирования ключа.
Запрос строк и хеширование значений для сравнения с хэшем моей входной строки было другой мыслью, но производительность была бы ужасной, я уверен:)
У кого-нибудь есть предложения, как лучше всего это сделать?
Спасибо