Обновление до последней версии SOLR 4.0. Затем следуйте инструкциям здесь: http://wiki.apache.org/solr/NearRealtimeSearch
Ключом к решению является использование программных коммитов при импорте твитов.
Мы используем систему, аналогичную описанной вами, и индексируем около 500 000 твитов в час без помех.
Отчасти проблема в том, что вы не можете настроить слишком много кэширования в этой среде, потому что вам нужно будет зафиксировать в какой-то момент. Когда это происходит, кеш исчезает, и включается автоподогрев. Убедитесь, что вы посмотрите на настройки автоподогрева. Также проверяйте журналы, когда выполняете запросы фасетов, на наличие признаков того, что количество уникальных значений в любом из фасетов не слишком велико. Мы все еще боремся с поворотными запросами к 6 миллионам уникальных пользователей. Это убивает вашу производительность. На практике это означает, что у нас все в порядке с 50M твитами или около того, выше это значительно замедляется, и мы ждем некоторых улучшений 4.0, чтобы решить эту проблему.