Я использую Mozenda (Mozenda.com) для очистки онлайновой базы данных, но некоторые данные находятся в файлах PDF.Мозенда не поддерживает очистку этих файлов, поэтому я ищу другое решение.
Есть два вопроса ...
Какой синтаксис XPath подходит длявыбрать URL из ссылки?Непонятно, как это сделать с помощью Mozenda, и URL-адреса PDF необходимы для реализации стороннего решения.
Что является хорошим инструментом для преобразования большого количества PDF-файлов онлайн в html,или еще лучше - поцарапать их?
Любые полезные предложения, безусловно, приветствуются.Я с удовольствием уточню ... просто спросите.