Я реализовал модель ngram, используя nltk
python, но меня беспокоит пространство, так как корпус рано или поздно станет большим.
- Как мы должны решить проблему масштабируемости этой модели?
- Должны ли мы использовать внешний магазин и хранить там n граммов?Например ElasticSearch.