Вопросы с тегом апач-тик - PullRequest

Вопросы с тегом апач-тик

1 голос
0 ответов

Я смотрю парсер для pdf для извлечения оглавления, чтобы определить начальный и конечный раздел В...

Judith Tan / 10 ноября 2019
0 голосов
0 ответов

Я пытаюсь использовать Tika в Python для извлечения текста из PDF-файлов. У меня установлена ​​Java...

Nipun / 08 ноября 2019
0 голосов
0 ответов

Я использую обработчик запросов / update / extract для отправки документов в solr, но некоторые...

user3420018 / 07 ноября 2019
0 голосов
0 ответов

У меня проблема с использованием Tika для определения языка (в python). Сначала я заметил, что...

Nico's / 06 ноября 2019
1 голос
1 ответ

Я хочу конвертировать doc / docx файлы в текстовые файлы. Мое требование заключается в том, что...

KARMVEER SINGH / 31 октября 2019
1 голос
1 ответ

У меня есть документ PDF, который я сейчас анализирую, используя Tika-Python. Я хотел бы разбить...

Graziella De Martino / 29 октября 2019
1 голос
2 ответов

Теперь я хочу удалить верхний и нижний колонтитул html-страницы. Я понял, что верхний и нижний...

Miguel A. Friginal / 25 октября 2019
0 голосов
0 ответов

Я использую Apache tika и пытаюсь извлечь текст из PDF. PDF выглядит хорошо, но когда я извлекаю, я...

brykneval / 24 октября 2019
0 голосов
0 ответов

Я запускаю немодифицированный экземпляр JAX-RS тика-сервера Apache 1.22 и использую его в качестве...

henrythewasp / 10 октября 2019
0 голосов
0 ответов

Tika-приложение извлекает страницы (числа / ключевые слова) в виде zip-файла и печатает только...

Santhosh / 10 октября 2019
0 голосов
0 ответов

Я использую Apache Tika для распознавания нескольких PDF-файлов. Когда я использую графический...

Parzival / 07 октября 2019
0 голосов
0 ответов

Я работаю над проектом, в котором нам нужно выполнить анализ текста файлов книг ePub. У меня есть...

ddjonline / 04 октября 2019
0 голосов
0 ответов

Я извлекаю текст с помощью tika server v1.20. Тика добавляет [закладки: xx] и [image: xx] в текст....

Montoya / 03 октября 2019
0 голосов
1 ответ

Я пытался определить язык по короткой фразе и был удивлен, так как результат обнаружения неверен....

Pavlo / 01 октября 2019
0 голосов
0 ответов

Apache Tika автоматически выполняет OCR, используя Tesseract в фоновом режиме.Я использую конечную...

user124114 / 25 сентября 2019
0 голосов
0 ответов

Я пытаюсь извлечь подробные сведения о документе Microsoft Word, используя библиотеку apache tika...

DMS / 24 сентября 2019
0 голосов
0 ответов

Я пытался найти решение для анализа PDF в HTML, поэтому позже я буду использовать beautifulsoup ,...

Ali Asad / 24 сентября 2019
1 голос
1 ответ

ОСНОВЫ Это приложение Java 1.8 Spring Boot 1.5. В настоящее время он использует Apache Tika 1.22...

Miss Kitty / 22 сентября 2019
0 голосов
0 ответов

у меня есть индекс в упругом поиске, в котором есть URL, мне нужно использовать Apache Tika для...

Rakesh / 09 июля 2019
1 голос
0 ответов

Я использую библиотеку Apche-tika для обнаружения Mimetype в Android, Android => O: она отлично...

Shiva / 08 июля 2019
0 голосов
0 ответов

В настоящее время я работаю над приложением Spring-Boot, которое может принимать данные файлов,...

MEZesUBI / 05 июля 2019
0 голосов
0 ответов

Я пытаюсь найти размер шрифта и стиль шрифта текста в pdf, используя python и Apache tika, но не...

S.Elakeya / 04 июля 2019
0 голосов
0 ответов

Превосходный lib tika-python в документации по https://github.com/chrismattmann/tika-python...

erfelipe / 30 июня 2019
0 голосов
1 ответ

Я получаю ошибку 422 при попытке обработать документы Microsoft (.docx, .xlsx и т. Д.) Через TEST...

andyy15 / 29 июня 2019
0 голосов
1 ответ

Я только начал изучать Apache Tika. Я хочу проверить, как работают процессы Apache Tika. Я пытался...

anand / 26 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...