Как лучше всего обращаться с фотографиями, переданными в IFilter? - PullRequest
0 голосов
/ 08 октября 2009

Я использую IFilter для индексации форматов изображений. Одной из проблем являются фотографии - многие пользователи имеют тонны фотографий, фотографии огромны, и загрузка текста на них занимает много времени.

Да, иногда люди используют вместо сканеров камеры для оцифровки документов, но потенциальные проблемы IMO намного превышают возможность встречи с документом, оцифрованным фотоаппаратом. Так что моя реализация вообще не будет извлекать текст из фотографий.

Что должен делать IFilter, когда обнаруживает, что данный файл является фотоизображением - указать ошибку или вернуть пустой текст?

1 Ответ

1 голос
/ 08 октября 2009

Если фильтр Word не обрабатывает отслеживаемые изменения, он не выдаст ошибку; было бы просто пропустить их. Хотя в вашем случае вы пропускаете целые файлы, это тот же принцип. Это не условие ошибки. Просто не возвращайте текст.

...