Я ищу программное обеспечение для управления большими коллекциями контента, например, 300 МБ HTML. Это требует ветвления и слияния, и должно быть распределено, если это возможно (т.е., dvcs).
Необходима полнотекстовая индексация.
Требуется веб-интерфейс.
Что-нибудь есть? Это большой проект, который занял бы у меня много времени.
Создавая его сам, я бы сочетал Git, JGit, Lucene и инфраструктуру Play.
Одна конкретная проблема заключается в том, что 300 МБ текста разделено на 200 000 файлов или записей. Это количество файлов обычно не быстрое, поэтому было бы неплохо пропустить стандартную рабочую модель файловой системы git ....