Вопросы с тегом апач-тик - PullRequest

Вопросы с тегом апач-тик

0 голосов
0 ответов

Я использую LanguageIdentifierUpdateProcessor для определения языка и, соответственно, для...

search_dev / 18 января 2012
1 голос
2 ответов

У меня есть следующий файл конфигурации для solr: <requestHandler...

bevacqua / 21 декабря 2011
3 голосов
2 ответов

Я пытаюсь опубликовать буквальное многозначное поле вместе с PDF-фрагментом.Кажется, только одно из...

paulusm / 15 декабря 2011
0 голосов
3 ответов

Я получаю исключение при попытке использовать обновление / извлечение файлов PDF Мои настройки: -...

paulusm / 09 декабря 2011
5 голосов
0 ответов

Я использую apache Tika 1.0.Используя ForkParser, каждый раз, когда я анализирую pdf-файлы, я...

anchovie / 08 декабря 2011
5 голосов
1 ответ

Я работаю с SOLR над проектом, в который мы импортируем кучу (~ 40 тыс. Элементов) богатых...

Pål Brattberg / 06 декабря 2011
2 голосов
2 ответов

Я сканирую веб-страницу и после сканирования извлекаю все ссылки с этой веб-страницы, а затем...

arsenal / 30 ноября 2011
0 голосов
2 ответов

Я сканирую веб-страницу и после сканирования извлекаю все ссылки с этой веб-страницы, а затем...

arsenal / 30 ноября 2011
4 голосов
3 ответов

Похоже, что Solr неправильно анализирует мои PDF-файлы.Мне было интересно, есть ли какая-либо...

Ravish Bhagdev / 16 ноября 2011
2 голосов
4 ответов

Я видел релиз 1.0 Apache Tika, который значительно облегчает извлечение метаданных в Java, и мне...

parser_failed / 15 ноября 2011
1 голос
0 ответов

Я индексирую документы с форматированным текстом в SOLR 3.4, используя ExtractingRequestHandler, и...

Pål Brattberg / 11 ноября 2011
0 голосов
0 ответов

У меня возникают трудности при выполнении Solr с Tika , мои документы продолжают падать при...

dfj / 10 ноября 2011
0 голосов
1 ответ

У меня проблема с извлечением текста из PDF в Solr. Solr использует Apache Tika для извлечения...

itsme / 08 ноября 2011
1 голос
1 ответ

У меня есть файл, который нужно проиндексировать на нашем сервере solr.Как я могу загрузить файл?Я...

ndee / 07 ноября 2011
2 голосов
3 ответов

Прежде всего, я прошел через все вопросы, касающиеся включения файлов jar для апплета. Но даже...

Anish / 02 ноября 2011
12 голосов
2 ответов

Когда я пытаюсь извлечь текст из моих файлов PDF, кажется, что я случайно вставляю пробелы между...

Ravish Bhagdev / 31 октября 2011
4 голосов
1 ответ

Я пытаюсь заставить Solr работать с Tika, чтобы я мог проиндексировать документы Word и PDF на...

John81 / 27 октября 2011
0 голосов
1 ответ

Я использую библиотеку PHP под названием solr-php-client (http://code.google

Travis / 13 октября 2011
4 голосов
2 ответов

Мой первый пост в Stack Overflow, так что будьте нежны, пожалуйста! Я собираюсь начать новый проект...

Mike / 12 октября 2011
2 голосов
1 ответ
0 голосов
1 ответ

Я пытаюсь проанализировать pdf-файл с помощью Apache Tika после обновления версии PDFBOX до 1.6.0 .

arsenal / 20 сентября 2011
1 голос
1 ответ

Я пытаюсь проанализировать pdf-файл, используя Apache Tika, используя ByteArrayInputStream для...

arsenal / 20 сентября 2011
2 голосов
1 ответ

Что не так с этим кодом ... Я пытаюсь разобрать pdf-файлы и извлечь из него текст ... Но для...

AKIWEB / 16 сентября 2011
1 голос
1 ответ

Я пытаюсь извлечь метаданные, используя apache tika, а затем помещая их в HashMap. Но мой код get -...

AKIWEB / 16 сентября 2011
1 голос
1 ответ

Я использую POI для извлечения данных из файла Excel. (5-й столбец в листе Excel содержит имена...

reuth / 07 сентября 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...