IBM рекомендует использовать звуковой формат Opus для аудио, передаваемого в службу Watson Speech to Text. Идея заключается в том, что Opus разработан специально для речи.
В противном случае говорится, что вы получите более качественную транскрипцию при отправке аудио в формате fla c, чем в формате mp3. Последний имеет очевидное преимущество в своем небольшом размере. В конце концов, существует ограничение в 100 МБ для отправки файлов. Таким образом, вы взвешиваете баланс ваших потребностей. Пока что все это имеет смысл.
Но если посмотреть на преобразования, сделанные в исходном WAV-файле, размер файла Opus сопоставим с размером mp3. одна из двух частот выборки, рекомендованных для использования сервиса), создала wav-файл размером 66.4 МБ. Если преобразовать его в fla c, то wav и opus произвели fla c: 43,6 Мб; mp3: 6,2 МБ; opus: 9,8 Мб.
Так действительно ли opus - лучший выбор для получения наиболее точной транскрипции? И как это может быть, когда он такой маленький по сравнению с fla c?