Я использую IFilter для индексации форматов изображений. Одной из проблем являются фотографии - многие пользователи имеют тонны фотографий, фотографии огромны, и загрузка текста на них занимает много времени.
Да, иногда люди используют вместо сканеров камеры для оцифровки документов, но потенциальные проблемы IMO намного превышают возможность встречи с документом, оцифрованным фотоаппаратом. Так что моя реализация вообще не будет извлекать текст из фотографий.
Что должен делать IFilter, когда обнаруживает, что данный файл является фотоизображением - указать ошибку или вернуть пустой текст?