Я использую AzureDirectory для полнотекстовой индексации в Azure, и я также получаю некоторые странные результаты ... но, надеюсь, этот ответ будет вам полезен ...
во-первых, опция составного файла: из того, что я читаю и выясняю, составной файл представляет собой один большой файл со всеми данными индекса внутри. все это приводит к тому, что в хранилище записывается множество файлов меньшего размера (настроенных с использованием функции SetMaxMergeDocs (int) IndexWriter). проблема в том, что как только вы получаете много файлов (я по глупости установил это около 5000), для загрузки индексов требуется время (на сервере Azure это занимает около минуты, от моего окна разработчика ... ну, его бегал уже 20 минут и все еще не закончил ...).
Что касается резервного копирования индексов, я еще не сталкивался с этим, но, учитывая, что у нас сейчас около 5 миллионов записей, и это будет расти, мне тоже интересно об этом. если вы используете один составной файл, возможно, загрузка файлов в рабочую роль, архивирование их и загрузка их с текущей датой будет работать ... если у вас есть меньший набор документов, вам может потребоваться повторная индексация данных если что-то пойдет не так ... но опять же, зависит от количества ....