У меня есть статическая коллекция из более чем 300 000 текстовых и HTML-файлов. Я хочу иметь возможность искать их по словам, точным фразам и в идеале шаблонам регулярных выражений Я хочу, чтобы поиски были быстрыми.
Я думаю, что поиск слов и фраз можно выполнить путем поиска словаря уникальных слов, относящихся к файлам, содержащим каждое слово, но есть ли способ получить достаточно быстрое соответствие регулярному выражению?
Я не против использовать существующее программное обеспечение, если оно существует.