Я нахожусь в процессе настройки системы, которая должна будет повторно анализировать большие объемы текста (например, String или StringBuffer - что может быть лучше?), Полученного из источника данных. Текст будет отображаться и может состоять из нескольких тысяч слов, и каждый раз, когда текст анализируется, каждое слово может проверяться по списку из 550 стоп-слов. Это позволит отфильтровать слова с экрана.
Так что мне интересно производительность, так как это может происходить одновременно в нескольких сеансах сервлетов; лучше проверить каждое слово по таблице базы данных MySQL (MyISAM или InnoDB), используя индекс? Или просто сохранить 550 слов в массиве или массиве Java в контексте сервлета, чтобы они могли быть прочитаны быстрее?
Так что мне интересно, как компромисс между вводом-выводом базы данных и хранением 550 строк в памяти.
Какой совет?
Спасибо
Мистер Морган.