API Google Speech to Text - mp3 файл - PullRequest
       11

API Google Speech to Text - mp3 файл

0 голосов
/ 19 сентября 2018

Мне удалось транскрибировать звук с помощью учебника, содержащегося в ссылке (https://cloud.google.com/speech-to-text/docs/async-recognize),, но он работает только со звуком в формате WAV. Я бы хотел, чтобы он работал со звуком в формате MP3 или M4A.

Я уже протестировал все возможности, содержащиеся в ссылке (https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/speech/cloud-client/src/main/java/com/example/speech/Recognize. java), и следуйте инструкциям в ссылке (https://cloud.google.com/speech-to-text/docs/encoding)

на главной странице Google Cloud,демонстрационный инструмент Speech API позволяет отправить файл mp3, и расшифровка расшифровки.

Я хотел бы получить помощь сообщества по моему запросу на транскрибирование звука продолжительностью более 1 минуты в формате mp3.

1 Ответ

0 голосов
/ 20 сентября 2018

Спасибо за вашу помощь.Но позвольте мне объяснить это по-другому.

На странице ссылка способы использования аудиофайла для транскрипции.Однако во всех возможностях, представленных в GitHub, ни одна из них не может транскрибировать звук в формате, отличном от WAV.Большинство моих файлов в форматах MP3 и M4A.

Я всегда получаю следующий ответ:

Exception in thread" main "java.lang.IndexOutOfBoundsException: Index: 0 at java.util.Collections $ EmptyList.get (Collections.java:4454) at com.logusit.speech.speech.SpeechApplication.main (SpeechApplication.java:50)

Я считаю, что проблема в RecognitionConfig в setEncoding иПараметры setSampleRateHertz.Я не могу найти правильную настройку JAVA для расшифровки файла, отличного от WAV.

...