Как я могу конвертировать xls в вики-текст при создании ссылок на адреса электронной почты? - PullRequest
0 голосов
/ 25 февраля 2011

У меня есть входной файл Excel, который я получил от третьего лица. Этот список включает в себя только имена, номера телефонов и адреса электронной почты. Я пытаюсь преобразовать файл из Excel в формат вики. Мой ход мыслей до сих пор использует 'xlhtml', чтобы включить его в текст. Затем я могу использовать pandoc -f html -t mediawiki emp2.txt -o emp3.txt, чтобы преобразовать его в вики-разметку. Проблема в том, что pandoc не переводит HTML-таблицы, созданные на первом этапе.

В качестве альтернативы, я могу использовать базовые sed, grep, awk и т. Д., Чтобы убрать html-теги, которые всегда будут одинаковыми, упрощая мою работу, но тогда у меня возникает проблема с использованием простых текстовых адресов электронной почты user@domain.com и превращая их в [mailto: user@domain.com], что я тоже не знаю, как это сделать. Я не какой маршрут лучше выбрать. Это не должно быть переносимым решением, поэтому я могу использовать python, perl, php, bash или любые другие утилиты на основе CLI.

Альтернативным маршрутом может быть экспорт документа Excel в CSV, а затем манипулирование им.

Примечание при использовании xlhtml, которое может помочь, адреса электронной почты форматируются как ссылки в Excel, поэтому xlhtml выводит их, используя <a href= ссылки, которые я хочу преобразовать в [mailto: user@domain.com]

1 Ответ

0 голосов
/ 01 марта 2011

так вы получите <a href="user@domain.com"> и хотите, чтобы оно было [mailto:user@domain.com]?

Поскольку все остальное - это имена и номера телефонов, почему бы вам просто не воспользоваться какой-либо программой редактирования текста и просто найти и заменить <a href=" на [mailto: и "> на ]

...