Вопросы с тегом текст-экстракция

0 голосов

0 ответов

Извлечение текста из PDF-страницы за страницей и построчно с PyMuPDF

Я должен извлечь текст из существующих документов PDF.В настоящее время я использую модуль PyMuPDF...

Rob2cc / 03 мая 2019

0 голосов

1 ответ

У меня есть строка, в которой я хочу извлечь и родство и имя

Как я могу написать регулярное выражение, которое будет извлекать "père" и "Tomy" из следующих...

Champlain Champlain / 03 мая 2019

1 голос

1 ответ

Автоматизируйте процесс для распознавания PDF и сделайте его доступным для поиска

Как следует из названия, я пытаюсь определить, можно ли передать в pdf OCR, чтобы сделать его...

dougmacklin / 01 мая 2019

1 голос

0 ответов

Руководство по извлечению объектов в неструктурированном документе с Python

История проекта: я новичок в НЛП, поэтому, пожалуйста, прости меня, если моя проблема кажется...

DLeung / 24 апреля 2019

0 голосов

1 ответ

Как найти имя из строки, используя Regex в NodeJs

Вот мой код, я написал отдельную функцию для регулярного выражения для извлечения шаблона имени,...

Ameya Salagre / 19 апреля 2019

0 голосов

0 ответов

Wagtail Textract (wagtail_textract) не транскрибируется при сохранении документа

ОС / веб-сервер: Ubuntu 16 (работает в Vagrant / VirtualBox) / Nginx, UWSGI Python: 3.6.8 Wagtail:...

Dan Swain / 16 апреля 2019

0 голосов

1 ответ

python pdfpage.extract_words выдает ошибку

У меня есть этот код в моем проекте, чтобы получить все слова из PDF. words = pdfPage.extract_words...

prasannakpechu / 15 апреля 2019

0 голосов

0 ответов

Извлечение текста для определенного (красного) цвета из изображения с использованием Python

Я пытаюсь извлечь красный цвет текста из изображения, используя cv2 и pytesseract. В настоящее...

Abhinav / 15 апреля 2019

1 голос

2 ответов

Извлекать PDF-текст внутри ограничительной рамки прямо в Python

Я пытаюсь извлечь текст из PDF в пределах данного ограничивающего прямоугольника. Я понимаю, что...

Evan Mata / 09 апреля 2019

0 голосов

0 ответов

Есть ли способ более точно выполнить извлечение текста из изображения?

Я пытаюсь извлечь текст из изображения, но при использовании рукописных изображений я не могу...

Ashish Krishan / 08 апреля 2019

0 голосов

1 ответ

как распечатать только конкретные данные из извлеченного текста?

Я уже извлек текст, но мне уже нужен раздел текста. Как распечатать только нужный раздел из текста,...

Ayushi Garg / 03 апреля 2019

0 голосов

0 ответов

Есть ли способ получить основной текст из любой статьи на сайте через расширение Chrome?

Я делаю некоторую обработку естественного языка для новостных статей и хочу иметь возможность...

Matthew Fishman / 01 апреля 2019

1 голос

1 ответ

Как извлечь из текста все экземпляры вектора строк на основе условий

Я относительно новичок в R и пытаюсь извлечь некоторые строки из текста (который является столбцом...

ayeh / 30 марта 2019

1 голос

1 ответ

Соответствующие Сокращения к их длинной форме

Попытка сопоставить акронимы с их значением - и аббревиатура, и значение находятся в одном и том же...

user2183943 / 28 марта 2019

0 голосов

0 ответов

Ищу инструмент / скрипт для извлечения всех отображаемых сообщений из моего проекта

У меня есть проект веб-разработки со многими подпапками и скриптами, написанными на HTML, PHP, JS и...

thoabel / 21 марта 2019

0 голосов

1 ответ

Есть ли способ сделать частичное совпадение строк в R?

У меня есть 2 кадра данных. Первый имеет большее количество строк и один столбец идентификатора...

Koyeli / 20 марта 2019

0 голосов

1 ответ

Функциональность OCR в Экспо

Поддерживает ли Expo / предоставляет ли какую-либо функциональность / API для извлечения текста из...

A.Hasan / 17 марта 2019

1 голос

1 ответ

Как я могу решить, что мое изображение содержит яркий текст или темный текст? [LabVIEW]

Я работаю над алгоритмом извлечения текста, в котором мне нужна помощь с настройкой порога...

Achuthaperumal RK / 15 марта 2019

0 голосов

1 ответ

Определение, в какой части текста изображения присутствует механизм распознавания

В настоящее время я работаю над проектом, связанным с OCR.Мне удалось разработать OCR-движок с...

Mousam Singh / 14 марта 2019

0 голосов

0 ответов

Пропуск части изображения

Я пытался извлечь текст из изображения с помощью Pytessaract, но он пропустил часть изображения.Но...

Technophile_2507 / 26 февраля 2019

0 голосов

0 ответов

Как удалить верхний и нижний колонтитулы при извлечении многостраничного PDF в текст с помощью PDFminer?

Я успешно извлек текст из многостраничных PDF-файлов, используя PDFminer.six в Python, и...

Peter / 21 февраля 2019

0 голосов

2 ответов

C # Извлечение нескольких строк в разных форматах из строки

Я не уверен, что это лучшее место, чтобы спросить это или нет, поэтому заранее извиняюсь, если нет....

Ian Boggs / 21 февраля 2019

0 голосов

0 ответов

Определите координаты, высоту и ширину прямоугольника в PDF для извлечения

Я хочу построить OCR для извлечения изображений и PDF для структурированных документов. Я хотел бы...

JDBennett / 19 февраля 2019

0 голосов

1 ответ

Как извлечь слова из списка фреймов данных списка MESH из PubMed в R

Я пытался извлечь данные из фрейма данных, который имеет вложенный список, но после попытки...

Manny Ma / 13 февраля 2019

0 голосов

0 ответов

Есть ли способ определить конфиденциальные данные в HTTP / HTTPS POST Body?

Я работаю над разработкой системы, которая может определять вероятность утечки конфиденциальных...

Bank Kodchakorn / 11 февраля 2019