У меня есть входной файл Excel, который я получил от третьего лица. Этот список включает в себя только имена, номера телефонов и адреса электронной почты. Я пытаюсь преобразовать файл из Excel в формат вики. Мой ход мыслей до сих пор использует 'xlhtml', чтобы включить его в текст. Затем я могу использовать pandoc -f html -t mediawiki emp2.txt -o emp3.txt
, чтобы преобразовать его в вики-разметку. Проблема в том, что pandoc не переводит HTML-таблицы, созданные на первом этапе.
В качестве альтернативы, я могу использовать базовые sed, grep, awk и т. Д., Чтобы убрать html-теги, которые всегда будут одинаковыми, упрощая мою работу, но тогда у меня возникает проблема с использованием простых текстовых адресов электронной почты user@domain.com и превращая их в [mailto: user@domain.com], что я тоже не знаю, как это сделать. Я не какой маршрут лучше выбрать. Это не должно быть переносимым решением, поэтому я могу использовать python, perl, php, bash или любые другие утилиты на основе CLI.
Альтернативным маршрутом может быть экспорт документа Excel в CSV, а затем манипулирование им.
Примечание при использовании xlhtml, которое может помочь, адреса электронной почты форматируются как ссылки в Excel, поэтому xlhtml выводит их, используя <a href=
ссылки, которые я хочу преобразовать в [mailto: user@domain.com]