Я хотел бы понять разницу между моделями ARPA (например, в SRILM) и моделью word2vec (которая является прогностической моделью).
Я работал над Kaldi допоздна и понимаю концепцию ARPA в этом контексте.Теперь я считаю, что word2vec - модель скип-граммы.Однако то же самое можно применить и к моделям ARPA.В этом контексте, является ли модель ARPA разновидностью word2vec?
Хотя это немного широкий вопрос, однако, ни существующие SO, ни Google не дают ясности по этому вопросу.