Я преобразовал некоторые PDF-файлы (в виде 2 столбцов текста) в обычный текст с помощью "pdttotext -layout".
Теперь я хотел бы выбрать текстовые выдержки из этих текстовых файлов.
1 Column1 bla bla bla Column2 ble ble ble
2 Column1 bla bla bla Column2 ble ble ble
3 Column1 bla bla bla Column2 ble ble ble
4 Column1 bla bla bla Column2 ble ble ble
5 Column1 bla bla bla Column2 ble ble ble
6 Column1 bla bla bla Column2 ble ble ble
Есть ли библиотека javascript (предпочтительно) или расширение для браузера, которое позволяет мне выбирать прямоугольную область?Чтобы я мог выбрать текст только из столбца 2.
Как показывает пример, расстояние между столбцами фиксировано, поэтому попытка разбить на основе регулярного выражения (/ \ s {2,} /) не выполняетсявопрос.(строка 5 потерпит неудачу)
(к сожалению, pdftotext без опции -layout шифрует некоторый контент).