У меня сейчас есть две языковые модели нграмм (model_A
и model_B
).
- они обучаются на основе различных корпусов, поэтому словарный запас отличается
- онисглаженный с откатом, хранится в формате
ARPA
, поэтому у меня есть 2 ARPA
файлов, ARPA_A
и ARPA_B
.
Теперь, если я хочу их интерполировать, то есть с учетом любой фразы ABC.
model_C(ABC) = 0.5 * model_A(ABC) + 0.5 * model_B(ABC)
Как объединить ARPA_A
и ARPA_B
в один (ARPA_C
)?