Как читать текст, как блокнот? - PullRequest
2 голосов
/ 22 апреля 2020

У меня есть файлы PDF, и у него есть такие таблицы (просто метафора)

      American | Asian | African | European | Middle
      Animals  |       | Animals | pottery  |  East
               | tree  | Flying  |  fragile | 
2010     2         6        19         12        14
2011     3         5         9          9        20
2012     9         2        14          0         1

Когда я извлекаю эту таблицу с помощью пакетов PDFtools или tabulizer, пакеты извлекают эту строку построчно.

Таким образом, результат для первой строки будет

American Asian African European Middle \r\n Animals  Animals pottery East \r\n  tree Flying fragile \r\n

Но я хочу извлечь именно это

American Animals Asian tree African Animals Flying European pottery fragile Middle East

Есть ли способ извлечь это правильно?

Также случайно я заметил, что когда я перетаскиваю и копирую, а затем вставляю эту таблицу в Блокнот окна, тогда блокнот читает магически так:

American Animals Asian tree African Animals Flying European pottery fragile Middle East

Так что я думаю, что создаю некоторый код, который автоматически вставляет таблицу в блокнот затем скопируйте его в R так, чтобы непосредственно вставить в некоторую переменную. Я также хочу знать, как можно реализовать это в кодировании R.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...