Вопросы с тегом текст-экстракция - PullRequest

Вопросы с тегом текст-экстракция

2 голосов
2 ответов

Я использую PDFBox для извлечения текста из PDF. PDF имеет табличную структуру, которая довольно...

Thilo / 11 января 2011
0 голосов
1 ответ
0 голосов
2 ответов

Я после специализированного экстрактора файлов обычного текста. Во-первых, прежде чем люди кричат...

mP. / 24 декабря 2010
1 голос
3 ответов

Я хотел бы преобразовать HTML в простой текст, но сохранить минимальную структуру. Все разделы,...

hippietrail / 09 декабря 2010
1 голос
4 ответов

Доброе утро Я пытаюсь получить строку таблицы (TR), которая должна иметь одну или несколько ячеек...

Junior M / 25 ноября 2010
0 голосов
1 ответ

System.ArgumentException не было обработано кодом пользователя.ComputeBytesPerRow (PdfDictionary...

NRK / 24 ноября 2010
1 голос
4 ответов

Предположим, у меня есть текстовый файл жанров фильмов с моими любимыми фильмами под каждый жанр....

Reznor / 10 ноября 2010
5 голосов
6 ответов

Мне нужно извлечь текст из PDF-файлов с помощью iText. Проблема в том, что некоторые PDF-файлы...

Rim / 27 октября 2010
0 голосов
3 ответов

Не удалось найти лучший заголовок, но мне нужно Regex для извлечения ссылки из примера ниже. snip..

nLL / 24 октября 2010
1 голос
1 ответ

Поскольку я новичок в REGEX, я не могу решить следующую вещь. И, пожалуйста, поделитесь ссылками,...

vrbilgi / 25 августа 2010
2 голосов
4 ответов

Привет! Я читаю строку, разбиваю каждое слово и сортирую его по имени, электронной почте и номеру...

silent / 21 августа 2010
3 голосов
1 ответ

У меня есть несколько PDF-файлов, которые были созданы из файлов Word или Excel. Мне нужно получить...

pooky / 20 августа 2010
0 голосов
1 ответ

У меня есть огромный набор данных таблиц в формате документов Open Office 3.0 . Table 1: (x...

Emil / 19 августа 2010
4 голосов
4 ответов

Мне известны такие утилиты, как html2text, BeautifulSoup и т. Д., Но проблема в том, что они также...

demos / 03 июля 2010
4 голосов
3 ответов

Есть ли (ненавязчивый для пользователя) способ получить весь текст на странице с помощью Javascript

Stavros Korokithakis / 07 июня 2010
0 голосов
1 ответ

Я хочу извлечь определенные элементы из большого количества неструктурированных документов. Эти...

jn29098 / 01 июня 2010
1 голос
1 ответ

Я хочу прочитать pdf-файл с оригинальным содержимым, таким как его шрифт (возможно, какой-то размер...

kalpesh / 21 мая 2010
0 голосов
2 ответов

Я хочу извлечь некоторые ключевые слова из строки запроса для приложения поиска в asp.net. Сначала...

jkirkerx / 08 мая 2010
3 голосов
4 ответов

Мне нужно несколько направлений для решения следующей проблемы: У меня много файлов InDesign, и мне...

PeterMmm / 05 мая 2010
14 голосов
2 ответов

Я уже задавал подобный вопрос ранее, но я заметил, что у меня есть большие ограничения: я работаю...

Hellnar / 04 мая 2010
3 голосов
2 ответов

Я пытаюсь разобраться с Попплером и его (отсутствием) документации. То, что я хочу сделать, - это...

nico / 28 апреля 2010
2 голосов
2 ответов

Я хочу получить %tagname% из файла и скопировать их в словарь только tagname в python.

DukeNukem / 19 апреля 2010
1 голос
0 ответов

Posterous позволяет публиковать множество объектов по электронной почте. Мы хотели бы разрешить...

ming yeow / 26 марта 2010
0 голосов
5 ответов

В основном я хочу извлечь строки "AAA", "BBB", "CCC", "DDD" из текстового файла ... ...... (other...

Abhijeet Rastogi / 17 марта 2010
1 голос
1 ответ

Мне нужно извлечь содержимое окна, если оно основано на тексте или хотя бы пути к файлу, связанному...

steffar / 17 марта 2010
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...