Я хочу создать программу, которая будет читать введенный текст, анализировать каждое слово и сохранять его в структуре данных, чтобы впоследствии я мог получить некоторую статистику об этом (частота слов, наиболее распространенное слово и т. Д.).
Мне нужно руководство о двух вещах:
a. лучший подход для моей "функции разбора", которая разделит текст на термины
b. лучший подход для выбора структуры данных, в том, что касается сложности, времени доступа и наилучшего соответствия для конкретного случая.