Я использую Amazon Transcribe для преобразования звонков в службу поддержки клиентов в текст. Проблема в том, что некоторые вызовы на хинди, некоторые - на английском sh, а некоторые представляют собой смесь обоих. У меня нет способа узнать, есть ли какие-то конкретные звонки на английском, английском или хинди или микс, без прослушивания.
Пока что решение, о котором я думал, - это преобразовать текст на обоих языках (хинди и английский sh), найти среднее значение доверительных оценок для каждого слова в вызове и сохранить транскрипцию с максимальной средней оценкой достоверности. Проблема в том, что этот процесс будет стоить моей компании вдвое больше, чем должно быть.
Пожалуйста, предложите мне выход из этого.