Я должен извлечь текст из существующих документов PDF.В настоящее время я использую модуль PyMuPDF...
Как я могу написать регулярное выражение, которое будет извлекать "père" и "Tomy" из следующих...
Как следует из названия, я пытаюсь определить, можно ли передать в pdf OCR, чтобы сделать его...
История проекта: я новичок в НЛП, поэтому, пожалуйста, прости меня, если моя проблема кажется...
Вот мой код, я написал отдельную функцию для регулярного выражения для извлечения шаблона имени,...
ОС / веб-сервер: Ubuntu 16 (работает в Vagrant / VirtualBox) / Nginx, UWSGI Python: 3.6.8 Wagtail:...
У меня есть этот код в моем проекте, чтобы получить все слова из PDF. words = pdfPage.extract_words...
Я пытаюсь извлечь красный цвет текста из изображения, используя cv2 и pytesseract. В настоящее...
Я пытаюсь извлечь текст из PDF в пределах данного ограничивающего прямоугольника. Я понимаю, что...
Я пытаюсь извлечь текст из изображения, но при использовании рукописных изображений я не могу...
Я уже извлек текст, но мне уже нужен раздел текста. Как распечатать только нужный раздел из текста,...
Я делаю некоторую обработку естественного языка для новостных статей и хочу иметь возможность...
Я относительно новичок в R и пытаюсь извлечь некоторые строки из текста (который является столбцом...
Попытка сопоставить акронимы с их значением - и аббревиатура, и значение находятся в одном и том же...
У меня есть проект веб-разработки со многими подпапками и скриптами, написанными на HTML, PHP, JS и...
У меня есть 2 кадра данных. Первый имеет большее количество строк и один столбец идентификатора...
Поддерживает ли Expo / предоставляет ли какую-либо функциональность / API для извлечения текста из...
Я работаю над алгоритмом извлечения текста, в котором мне нужна помощь с настройкой порога...
В настоящее время я работаю над проектом, связанным с OCR.Мне удалось разработать OCR-движок с...
Я пытался извлечь текст из изображения с помощью Pytessaract, но он пропустил часть изображения.Но...
Я успешно извлек текст из многостраничных PDF-файлов, используя PDFminer.six в Python, и...
Я не уверен, что это лучшее место, чтобы спросить это или нет, поэтому заранее извиняюсь, если нет....
Я хочу построить OCR для извлечения изображений и PDF для структурированных документов. Я хотел бы...
Я пытался извлечь данные из фрейма данных, который имеет вложенный список, но после попытки...
Я работаю над разработкой системы, которая может определять вероятность утечки конфиденциальных...