Моя база данных сохраняет резюме как поле данных BLOB-объектов.Резюме могут быть Microsoft Word, PDF или изображения (.jpg и т. Д.). Как мы можем создать индекс Lucene из этих разнородных типов файлов, особенно файлов .jpg?Может ли Тика понимать отсканированные изображения?