Вопросы с тегом Апач-ТИК - PullRequest

Вопросы с тегом Апач-ТИК

0 голосов
0 ответов

Моя команда получила задание просмотреть ~ 3800 документов, чтобы узнать, какие из них полезно...

John Barnes / 24 мая 2018
0 голосов
0 ответов

Сейчас я тестирую извлечение полного текста с помощью Apache Tika.Я использую фасадный класс Tika с...

dkaras / 24 мая 2018
0 голосов
0 ответов

Я хотел бы извлечь содержимое из файла PDF.Я использую Apache Tika 1.15 в качестве инструмента...

Filip Górczyński / 22 мая 2018
0 голосов
1 ответ

Я использую java с apache tika 1.18 для конвертации некоторых файлов в TXT.Когда я пытаюсь...

Mike Moreira / 18 мая 2018
0 голосов
1 ответ

Я пытаюсь использовать Dropbox в качестве облачного хранилища файлов для приложения / скрипта....

Jared Stufft / 14 мая 2018
0 голосов
1 ответ

У нас есть действительно старые документы .doc.Обычно мы используем tika (наше приложение обычно...

Zanndorin / 14 мая 2018
0 голосов
0 ответов

Сервер Apache Tika REST предоставляет документ в формате PDF с кодом состояния пароля 422...

Oliver / 11 мая 2018
0 голосов
1 ответ

Я добавил Tika в качестве ссылки на мою реализацию StormCrawler, и это позволяет извлекать...

heythere / 11 мая 2018
0 голосов
0 ответов

Я пытаюсь извлечь все встроенные файлы в текстовый файл (docx) и поместить вложенные файлы в...

SakshamB / 08 мая 2018
0 голосов
0 ответов

Я использую Apache Tika 1.18, и когда я использую один фреймворк веб-сервиса (sparkjava), код ниже...

Morkus / 02 мая 2018
0 голосов
0 ответов

Я очень новичок в Apache Tika и пытаюсь понять, как его использовать. Я читал некоторые блоги через...

Apurw / 30 апреля 2018
0 голосов
0 ответов

Я использую Apache Tika 1.17 для извлечения контента из файлов PDF.На странице в PDF есть небольшое...

sivanr / 25 апреля 2018
0 голосов
1 ответ

Я портировал Apache Tika на Android. У меня есть основной вопрос. Работая над EPubParser, я могу...

somenath mukhopadhyay / 31 марта 2012
0 голосов
1 ответ

Я запускаю задание resque, которое содержит следующую строку: temp = %x(/usr/bin/java -jar...

ndee / 27 марта 2012
1 голос
2 ответов

Я использую DIH для индексации локальной файловой системы. Но путь к файлу, размер и поле...

liang_ecmkit / 27 марта 2012
0 голосов
1 ответ

Я хочу добавить PDF-файлы в Lucene Index (вероятно, я сделал).Теперь я хочу извлечь конкретный...

SENTHIL SARAVANAN / 23 марта 2012
1 голос
1 ответ

Я использую парсер Tika для индексации моих файлов в Solr. Я создал свой собственный парсер...

lotk / 23 февраля 2012
1 голос
2 ответов

Как я могу сделать Apache Tika индексировать каталог PDF и текстовые файлы, включая подкаталоги, и...

user1125872 / 17 февраля 2012
4 голосов
0 ответов

Я использую Apache Tika для извлечения метаданных из документов.В основном меня интересует...

pokita / 08 февраля 2012
0 голосов
2 ответов

В сущности, я реализую плагин, который будет получать содержимое веб-страниц и обрабатывать их...

Haya aziz / 07 февраля 2012
4 голосов
3 ответов

Утилита графического интерфейса Apache Tika предоставляет возможность получения основного...

CrazyCoder / 07 февраля 2012
1 голос
1 ответ

Я скачал исходную папку Apache Tika и установил Maven. Затем с помощью командной строки (mvn...

aliakbarian / 06 февраля 2012
1 голос
0 ответов

Можно ли получить содержимое буфера обмена из формата Microsoft Office с помощью Apache Tika? Как...

iberck / 03 февраля 2012
2 голосов
1 ответ

Я хочу убрать нерегулярный веб-контент - (может быть html, pdf image и т. Д.) В основном html.Я...

sriram / 03 февраля 2012
0 голосов
1 ответ

сначала я попытался определить язык фарси с помощью tika: как я могу определить веб-страницы на...

aliakbarian / 28 января 2012
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...