Как извлечь отдельный список записей из SQL или Excel - PullRequest
0 голосов
/ 07 августа 2010

У меня есть таблица Excel с 15 столбцами, одним из которых является EmailAddress, а затем более 100 000 записей.

В своих данных я знаю, что существует много дублирующих адресов электронной почты.

Можеткто-нибудь подскажет, как мне извлечь отдельный список, в котором каждая запись представлена ​​адресом электронной почты только один раз?

Альтернативно, если я импортирую данные в SQL, как я могу удалить записи, которые дублируются адресом электронной почты, но оставить одну записьесли 4 найдено ...

Thx ..

Ответы [ 2 ]

1 голос
/ 07 августа 2010

В более простых задачах я бы предложил использовать openrowset .Конечно, вы могли бы объединить это с другими запросами после этого, чтобы выполнить фильтрацию, но в этом случае было бы здорово использовать DTS для MSSQL2000 и SSIS для более поздних версий.

Как?
вопроссложный, и имеет 2 подвопроса, на которые нужно было ответить ранее.

  1. Как удалить дубликаты
  2. Excel и SQL

и вы можете прочитать больше о SSIS https://stackoverflow.com/search?q=SSIS+Excel

0 голосов
/ 09 августа 2010

См. Ссылку «Как удалить дубликаты» в ответе Александра, чтобы разобраться с ним в SQL.(Обратите внимание, что связанный ответ специфичен для SQLServer - синтаксис, вероятно, будет немного отличаться, если вы используете другие версии SQL.)

Для Excel я предлагаю либо:

  1. Используя сводную таблицу или
  2. Сортировка по EmailAddress, вставьте дополнительный столбец, заполненный формулами, похожими на:

    =IF(A1=A2,"","X")
    

    [- строка 2, предполагая, что EmailAddress находится в столбцеA;скопируйте и вставьте оставшуюся часть столбца] и используйте автофильтр для выбора рассчитанных значений X.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...