Подход к разработке пакета в R для преобразования PDF в HTML - PullRequest
0 голосов
/ 31 мая 2018

Я работаю над проектом по конвертации PDF в HTML с использованием R. Я знаю, что в R нет пакетов для этого.

Я был бы очень признателен, если бы какие-либо эксперты могли предоставить некоторые предложения или подходы.У меня есть подход, чтобы сделать это с помощью Python, но я ищу лучший стиль.

1 Ответ

0 голосов
/ 31 мая 2018

Два предложения:

  • Взгляните на существующий (с открытым исходным кодом) инструмент, который делает это.Это позволит вам учиться.https://github.com/itext/i7j-pdfhtml
  • Не изобретай велосипед заново.Используйте языковые привязки для вызова существующей библиотеки из R.

Взгляните на https://darrenjw.wordpress.com/2011/01/01/calling-java-code-from-r/.
Где автор объясняет, как вызывать Java из R. Если вы хотите использовать этот подход,Вы можете использовать iText pdfHTML

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...