Вопросы с тегом текст-экстракция - PullRequest

Вопросы с тегом текст-экстракция

61 голосов
4 ответов

У меня есть серия текстовых элементов - сырой HTML из базы данных MySQL. Я хочу найти наиболее...

arronsky / 16 марта 2010
1 голос
3 ответов

Я пытаюсь выяснить, как извлечь даты из неструктурированного текста, используя Ruby. Например, я бы...

user274862 / 17 февраля 2010
0 голосов
3 ответов

Если вы можете помочь с этим, вы гений. По сути, у меня будет такой текст: <parent wealthy>...

Click Upvote / 29 января 2010
11 голосов
9 ответов

Мой вопрос вроде , этот вопрос , но у меня есть больше ограничений: Я знаю, что документы...

BCS / 22 января 2010
12 голосов
6 ответов

Используя sed или подобное, как бы вы извлекли строки из файла? Если бы я хотел строки 1, 5, 1010,...

monkeyking / 07 января 2010
4 голосов
3 ответов

В моем приложении Windows я хочу обнаружить выбранный текст в «Internet Explorer», Firefox и любом...

Zee99 / 04 января 2010
17 голосов
8 ответов

Существует много научных работ по извлечению контента HTML, например, Gupta & Kaiser (2005)...

Charles Stewart / 26 декабря 2009
4 голосов
3 ответов

Мне нужно указать ключевое слово типа "синий металлический чайник" (с / без кавычек) и получить...

Click Upvote / 27 ноября 2009
4 голосов
2 ответов

Я ищу решение, похожее на PDFBox для PDF-файлов Apache Tika, однако для файлов PS. спасибо.

Oren Yosifon / 10 ноября 2009
2 голосов
1 ответ

Я делаю проект в Java, в котором я должен обработать файл дампа Википедии. Я ищу библиотеку для...

l2mt / 22 августа 2009
0 голосов
4 ответов

Для работы по контракту мне нужно оцифровать много старых PDF-файлов протоколов дебатов с...

Cetin Sert / 09 июля 2009
33 голосов
9 ответов

Я пытался извлечь текст (строку) из MS Word (.doc, .docx), Excel и Powerpoint, используя C #. Где я...

Elias Haileselassie / 18 июня 2009
1 голос
3 ответов

В настоящее время я использую комбинацию макросов OpenOffice и программы pdf2text для извлечения...

Miguel A. Friginal / 20 мая 2009
3 голосов
5 ответов

Я использую preg_replace () для замены строки. $str = "<aa>Let's find the stuff qwe...

Miguel A. Friginal / 10 апреля 2009
4 голосов
6 ответов

Каким будет хороший инструмент или набор инструментов для загрузки списка URL-адресов и извлечения...

Cammel / 12 января 2009
5 голосов
2 ответов

Мой отдел маркетинга, благослови их, решил устроить тотализатор, где люди заходят через...

Craig / 30 декабря 2008
4 голосов
5 ответов

Я работаю над алгоритмом, который попытается определить, учитывая файл HTML, что он считает...

Max / 14 ноября 2008
4 голосов
3 ответов

Как в Groovy захватить веб-страницу и удалить теги HTML и т. Д., Оставив только текст документа? Я...

Miguel A. Friginal / 16 октября 2008
15 голосов
12 ответов

Я хотел бы извлечь из общей HTML-страницы весь текст (отображается или нет). Я бы хотел удалить...

Ron Harlev / 08 октября 2008
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...