Как выделить текст в прямоугольной области? (Javascript / Браузеры / Приложения) - PullRequest
0 голосов
/ 21 марта 2019

Я преобразовал некоторые PDF-файлы (в виде 2 столбцов текста) в обычный текст с помощью "pdttotext -layout".

Теперь я хотел бы выбрать текстовые выдержки из этих текстовых файлов.

1 Column1 bla bla bla       Column2 ble ble ble
2 Column1 bla bla bla     Column2 ble ble ble
3 Column1 bla bla bla        Column2 ble ble ble
4 Column1 bla bla bla       Column2 ble ble ble
5 Column1 bla bla bla Column2 ble ble ble
6 Column1 bla bla bla        Column2 ble ble ble

Есть ли библиотека javascript (предпочтительно) или расширение для браузера, которое позволяет мне выбирать прямоугольную область?Чтобы я мог выбрать текст только из столбца 2.

Как показывает пример, расстояние между столбцами фиксировано, поэтому попытка разбить на основе регулярного выражения (/ \ s {2,} /) не выполняетсявопрос.(строка 5 потерпит неудачу)

(к сожалению, pdftotext без опции -layout шифрует некоторый контент).

...