Я собираюсь реализовать поисковую систему изображений, в основном цель состоит в том, чтобы позволить пользователю искать в хранилище изображений по текстовому запросу. Более того, я должен справиться с этой частью проекта.
Я изучаю информационный поиск, и у меня есть базовые знания Lucene , Solr и Nutch . Инструменты, которые я должен использовать
Итак, мои вопросы, которые немного «абстрактны» на данном этапе проекта:
- Как сканировать изображения?
У меня нет ограничений на наличие изображений в моем наборе данных, мне просто нужно что-то около 1000 файлов. первый вариант - просто использовать случайные изображения, но, может быть, я могу сделать что-то лучше (например, создать описание изображения во время сканирования или что-то в этом роде)
- Как мне проиндексировать эти изображения?
Опять же, я думаю, мне понадобится хотя бы описание каждого изображения, или, может быть, список дескрипторов ... Есть ли какой-нибудь сервис для его динамического построения на основе изображения?
После сборки остальная часть работы должна быть тривиальной, поскольку у меня будет набор данных и индекс, но если у вас есть предложения, не стесняйтесь давать советы.