Добавление ускоренной адаптации к облачной речи Google в java - PullRequest
1 голос
/ 22 января 2020

Я использую облачный речевой API Google для преобразования речи в текст через микрофон. Может кто-нибудь сказать мне, как я могу добавить адаптацию буста к своему java коду, чтобы я мог назначить правильные значения буста для определенных фраз. Мне нужно сделать это в java. Я прочитал документ Google, в котором показано, как вы можете добавить значения в json запрос: вот эта ссылка: "https://cloud.google.com/speech-to-text/docs/speech-adaptation" (внизу)

мне нужно сделать то же самое в java.

Ответы [ 2 ]

1 голос
/ 24 января 2020

Вы можете использовать setBoost в SpeechContext построителе и addSpeechContexts в RecognitionConfig построителе.

List<String> phrases = new ArrayList<String>();
phrases.add("Sheryar");
SpeechContext item = SpeechContext.newBuilder().addAllPhrases(phrases).setBoost(20f).build();
RecognitionConfig recognitionConfig = RecognitionConfig.newBuilder().setEncoding(RecognitionConfig.AudioEncoding.LINEAR16).setLanguageCode("en-IN").addSpeechContexts(item).setSampleRateHertz(48000).setEnableWordTimeOffsets(true);

Вам необходимо выполнить следующие операции импорта:

import com.google.cloud.speech.v1p1beta1.RecognitionAudio;
import com.google.cloud.speech.v1p1beta1.RecognitionConfig;
import com.google.cloud.speech.v1p1beta1.RecognizeRequest;
import com.google.cloud.speech.v1p1beta1.RecognizeResponse;
import com.google.cloud.speech.v1p1beta1.SpeechClient;
import com.google.cloud.speech.v1p1beta1.SpeechContext;
import com.google.cloud.speech.v1p1beta1.SpeechRecognitionAlternative;
import com.google.cloud.speech.v1p1beta1.SpeechRecognitionResult;

И вам нужно добавить следующую зависимость к вашему пом:

<!-- https://mvnrepository.com/artifact/com.google.cloud/google-cloud-speech -->
<dependency>
    <groupId>com.google.cloud</groupId>
    <artifactId>google-cloud-speech</artifactId>
    <version>1.22.2</version>
</dependency>
0 голосов
/ 04 февраля 2020

Проведя небольшое исследование и прочитав официальную документацию, я наконец нашел решение этой проблемы в облачном речевом документе. Ответ, упомянутый абсином, также является правильным, и здесь я нашел решение.

: https://cloud.google.com/speech-to-text/docs/context-strength

Спасибо за помощь: -)

...