Поиск неправильно отформатированных адресов электронной почты в файле CSV - PullRequest
1 голос
/ 23 июня 2009

У меня есть CSV-файл, полный контактной информации, и я пытаюсь загрузить его в контакты GMail, но адреса электронной почты не все правильно отформатированы, поэтому GMail не распознает его как электронную почту поле. Я могу открыть файл CSV в Excel (Mac), но я не знаю, есть ли способ сопоставления с образцом в Excel. Кроме того, некоторые поля могут содержать запятые (например, поля адреса), поэтому использование sed / awk может быть затруднено. Можно ли как-то быстро найти адреса электронной почты, которые неправильно отформатированы?

Ответы [ 3 ]

1 голос
/ 23 июня 2009

digdb - плагин Excel для проверки адресов электронной почты, которые могут быть полезны для вас. Это не бесплатно, но есть ограниченное по времени бесплатное демо, которое вы могли бы по крайней мере использовать, чтобы увидеть, делает ли оно то, что вы хотите. Я не пробовал это сам, но он обнаружился в моем поиске Google, когда я пытался найти тот, который я использовал далеко назад (и больше не могу найти)

1 голос
/ 23 июня 2009

Откройте ваш CSV-файл в текстовом редакторе с поддержкой регулярных выражений, например TextWrangler (поскольку вы работаете на Mac, бесплатно). Затем запустите поиск по регулярному выражению и исправьте найденные результаты вручную, поскольку возможные проблемы могут быть действительно искажены. Проще, если столбец электронной почты стоит первым.

Предполагается, что адрес электронной почты стоит первым и не заключен в кавычки:

^(?![A-Z0-9\._%\+\-]+@[A-Z0-9.-]{2,}\.[A-Z]{2,4},)

Примечание:

  • с использованием отрицательного просмотра здесь, чтобы найти неправильные совпадения, надеюсь, ваш редактор его поддерживает (не на моем Mac сейчас)
  • , если все адреса электронной почты имеют кавычки, добавьте кавычку "после первого! И перед последним,
1 голос
/ 23 июня 2009

сбросьте адреса в текстовый файл, затем запустите файл через findstr (как встроенная команда windows cmd) и заставьте его повторить соответствующие шаблоны:

например:

findstr /V "\b[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}\b"  input_emails.txt > bad_emails.txt
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...