Вы можете попытаться определить текстовый индекс для ваших двоичных файлов. Я не знаю, будет ли это работать, но даже если это произойдет, такой индекс будет соответствовать любым словам, которые являются частью формата файла , а не пользовательскому контенту, который обычно нежелателен.
Если бы я выполнял ваши требования, я бы использовал преобразователь из всех двоичных документов в простой текст (например, pando c), получая, таким образом, пользовательское содержимое каждого из документов, затем вставляя это содержимое в поле с текстовым индексом, затем запросите это поле.