Вопросы с тегом апач-тик - PullRequest

Вопросы с тегом апач-тик

2 голосов
2 ответов

Я использую Solr 3.1, Apache Tika 0.9 и Solrnet 0.3.1 для индексирования документа, например, файла...

Dhaval950 / 05 мая 2011
10 голосов
3 ответов

Кажется, что вся документация, которую я могу найти, предполагает, что я могу извлечь только...

Asif Sheikh / 29 апреля 2011
0 голосов
1 ответ

Я успешно настроил Solr 3.1 с Apache tika 0.9 Я не изменяю файл Schema.xml (схема по умолчанию) и...

Dhaval950 / 26 апреля 2011
0 голосов
1 ответ

Можете ли вы дать мне шаги по настройке Tika 0.9 с Solr 3.1 <requestHandler...

Dhaval950 / 20 апреля 2011
2 голосов
1 ответ

есть ли в Apache Tika парсер для типа application/octet-stream? Я полагаю, что это не анализируемый...

lisak / 01 апреля 2011
0 голосов
2 ответов
7 голосов
2 ответов

Я загружаю библиотеки tika-core и tika-parser, но не могу найти примеры кодов для разбора...

lkalay / 25 марта 2011
0 голосов
1 ответ

Я получаю эту ошибку при компиляции Apache Tika последней версии на Debian. Любая помощь будет...

Alex Kleshchevnikov / 22 марта 2011
1 голос
1 ответ

Как извлечь текст из файла .tex с помощью Apache Tika? Файл примера находится в http://www.tug

nikhil500 / 15 марта 2011
0 голосов
1 ответ

Я использую тика с dataimporthandler. при выполнении полного импорта я получаю следующие ошибки....

Brahmaji Rao / 11 марта 2011
1 голос
1 ответ

Я немного использовал Alfresco, а над Apache Tika был тонкий слой абстракции для извлечения...

lisak / 01 марта 2011
2 голосов
1 ответ

У меня есть теоретический вопрос.У меня есть тонны документов различных форматов (ODS, MS office,...

lisak / 28 февраля 2011
7 голосов
1 ответ

Я занимаюсь простой обработкой различных документов (ODS, MS office, pdf) с помощью Apache Tika.Я...

lisak / 27 февраля 2011
1 голос
2 ответов

Я использую apache tika для обнаружения mime-типов аудио и видео файлов.По какой-то причине tika...

Ajith Jose / 11 февраля 2011
2 голосов
1 ответ

Нам нужно получить древовидную структуру из данного текстового документа, используя Java....

Arttu / 10 февраля 2011
2 голосов
1 ответ

Я новичок в Apache Solr и хочу использовать его для индексации PDF-файлов. Мне удалось его...

DeX3 / 09 февраля 2011
5 голосов
1 ответ

Чтобы проиндексировать мой сайт, у меня есть скрипт Ruby, который, в свою очередь, генерирует...

Dan Tenenbaum / 09 февраля 2011
0 голосов
1 ответ

Я видел эту ссылку: http://www.lucidimagination

ali / 14 декабря 2010
5 голосов
1 ответ

Я индексирую PDF-файлы с помощью Solr, используя ExtractingRequestHandler.Я хотел бы отобразить...

Daniel Hepper / 04 ноября 2010
0 голосов
1 ответ

Можете ли вы использовать ExtractingRequestHandler и Tika с любым из форматов сжатых файлов (zip,...

Richie Rich / 25 октября 2010
5 голосов
2 ответов

Я хочу проиндексировать большое количество PDF-документов. Я нашел ссылку, показывающую, что это...

Ahsan Iqbal / 05 октября 2010
2 голосов
1 ответ

Каков наилучший способ индексирования PDF-документов?Должен ли я индексировать их путем...

Ahsan Iqbal / 18 сентября 2010
0 голосов
2 ответов

Я работаю над проектом, в котором мне нужно извлечь данные XML (карта сайта) из файла gz с помощью...

Natsabari / 16 августа 2010
1 голос
1 ответ

Я индексирую сообщения в SOLR с полями "name", "title" и "description". Позже я хотел бы добавить...

Matt Hampel / 28 июля 2010
1 голос
1 ответ

Я использую SOLR's ExtractingRequestHandler для загрузки текста документов. Все примеры в...

Matt Hampel / 27 июля 2010
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...