Вопросы с тегом Апач-ТИК - PullRequest

Вопросы с тегом Апач-ТИК

1 голос
1 ответ

Я хочу интегрировать Apache Tika в мой проект Java. Мне нужно получить текст из разных форматов...

reuth / 06 сентября 2011
0 голосов
1 ответ

Привет! Я использую Apache Tika, и я внес несколько изменений в Tika согласно своему требованию, и...

ramesh / 25 августа 2011
4 голосов
1 ответ

Я пытаюсь создать пользовательский xpath contentHandler для tika, который распознает сложное...

surajz / 24 августа 2011
0 голосов
1 ответ

Существует ли быстрый способ надежного определения типа сжатия файла по его содержимому (т.е. не по...

PNS / 20 августа 2011
3 голосов
0 ответов

Мой вопрос является просто продолжением этой операции, где я хотел бы отобразить страницу № для...

Balaji.N.S / 18 августа 2011
2 голосов
2 ответов

Я использую tika для извлечения текста из pdf-файла с большим количеством таблиц. java -jar...

surajz / 15 августа 2011
1 голос
0 ответов

Я использую Solr 3.3 и пытаюсь извлечь и проиндексировать метаданные из файлов PDF.Я использую...

sabman / 01 августа 2011
2 голосов
1 ответ

Я пытаюсь проиндексировать некоторые документы PDF, а затем создать пользовательский интерфейс...

Balaji.N.S / 25 июля 2011
2 голосов
4 ответов

Какие шаги для проверки целостности этих документов? doc,docx,docm,odt,rtf,pdf,odf,odp,xls,xlsx...

lisak / 25 июля 2011
1 голос
2 ответов

Я успешно установил Solr 1.4.1, но не могу заставить Tika 0.4 (которая включена в contrib /...

Travis / 21 июля 2011
4 голосов
1 ответ

Я использую Solr для индексирования файлов DOC, DOCX и PDF. Я включил сохраненный для текста и...

Jesvin Jose / 20 июля 2011
0 голосов
2 ответов

Как мне извлечь текст из URL?В моем коде он извлекает исходный код этого URL ... DefaultHttpClient...

arsenal / 16 июля 2011
15 голосов
5 ответов

Может кто-нибудь указать мне на учебник. Мой основной опыт работы с Solr - это индексирование...

Mark / 14 июля 2011
0 голосов
1 ответ

Можно ли индексировать форматированный документ (pdf, office) ... с помощью обработчика импорта...

bobosh / 13 июля 2011
7 голосов
4 ответов

Можно ли извлечь текст из URL с помощью Tika?Любые ссылки будут оценены.Или TIKA можно использовать...

arsenal / 12 июля 2011
4 голосов
1 ответ

Я пытаюсь проанализировать простой текстовый файл, используя Tika, но получаю непоследовательность...

PNS / 08 июля 2011
1 голос
2 ответов

Привет, я наивный пользователь, когда дело доходит до Solr. Пожалуйста, объясните мне следующие...

Balaji.N.S / 26 июня 2011
1 голос
2 ответов

Мне нужно проиндексировать некоторые XML-документы с помощью Lucene, но перед этим мне нужно...

Kitinz / 20 июня 2011
0 голосов
1 ответ

Мне нужно проиндексировать содержимое файлов doc / docx / pdf, загруженных пользователями, и...

Yuriy / 16 июня 2011
7 голосов
2 ответов

Я ищу альтернативу C / C ++ для Apache Tika framework, которая основана на Java.В частности, я ищу...

Nik / 04 июня 2011
7 голосов
1 ответ

Я пытаюсь индексировать с помощью запроса на основе curl запрос curl...

naveen gupta / 31 мая 2011
14 голосов
1 ответ

Может кто-нибудь помочь мне разобраться? Это можно сделать так Tika tika = new Tika(); tika

lisak / 27 мая 2011
5 голосов
2 ответов

Я хочу иметь возможность создавать новый анализатор Tika для извлечения метаданных из файла. Мы уже...

George / 18 мая 2011
1 голос
1 ответ

У меня есть веб-приложение jsp с пользовательской поисковой системой. Поисковая система в основном...

Andy76 / 17 мая 2011
2 голосов
1 ответ

Я пытаюсь просканировать все файлы pdf / doc в каталоге.Это прекрасно работает, и я могу...

Daniel Rijkhof / 13 мая 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...