Я использую Solr 3.1, Apache Tika 0.9 и Solrnet 0.3.1 для индексирования документа, например, файла...
Кажется, что вся документация, которую я могу найти, предполагает, что я могу извлечь только...
Я успешно настроил Solr 3.1 с Apache tika 0.9 Я не изменяю файл Schema.xml (схема по умолчанию) и...
Можете ли вы дать мне шаги по настройке Tika 0.9 с Solr 3.1 <requestHandler...
есть ли в Apache Tika парсер для типа application/octet-stream? Я полагаю, что это не анализируемый...
Во-первых, мне нужно скачать tika-bundle-0.9.jar, но я не могу его найти. Вскоре я написал эти try...
Я загружаю библиотеки tika-core и tika-parser, но не могу найти примеры кодов для разбора...
Я получаю эту ошибку при компиляции Apache Tika последней версии на Debian. Любая помощь будет...
Как извлечь текст из файла .tex с помощью Apache Tika? Файл примера находится в http://www.tug
Я использую тика с dataimporthandler. при выполнении полного импорта я получаю следующие ошибки....
Я немного использовал Alfresco, а над Apache Tika был тонкий слой абстракции для извлечения...
У меня есть теоретический вопрос.У меня есть тонны документов различных форматов (ODS, MS office,...
Я занимаюсь простой обработкой различных документов (ODS, MS office, pdf) с помощью Apache Tika.Я...
Я использую apache tika для обнаружения mime-типов аудио и видео файлов.По какой-то причине tika...
Нам нужно получить древовидную структуру из данного текстового документа, используя Java....
Я новичок в Apache Solr и хочу использовать его для индексации PDF-файлов. Мне удалось его...
Чтобы проиндексировать мой сайт, у меня есть скрипт Ruby, который, в свою очередь, генерирует...
Я видел эту ссылку: http://www.lucidimagination
Я индексирую PDF-файлы с помощью Solr, используя ExtractingRequestHandler.Я хотел бы отобразить...
Можете ли вы использовать ExtractingRequestHandler и Tika с любым из форматов сжатых файлов (zip,...
Я хочу проиндексировать большое количество PDF-документов. Я нашел ссылку, показывающую, что это...
Каков наилучший способ индексирования PDF-документов?Должен ли я индексировать их путем...
Я работаю над проектом, в котором мне нужно извлечь данные XML (карта сайта) из файла gz с помощью...
Я индексирую сообщения в SOLR с полями "name", "title" и "description". Позже я хотел бы добавить...
Я использую SOLR's ExtractingRequestHandler для загрузки текста документов. Все примеры в...