Доступ к речевому текстовому ответу Google Cloud - PullRequest
1 голос
/ 07 апреля 2019

Я новичок в этом деле, и я надеюсь, что кто-то может указать мне верное направление: я использовал Google Cloud Speech-to-text API, в частности метод longrunningrecognize. Теперь все работает, и я получаю ожидаемые результаты:

{
  "name": "4983661747957213554",
  "metadata": {
    "@type": 
"type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "progressPercent": 100,
    "startTime": "2019-04-07T10:22:26.018723Z",
    "lastUpdateTime": "2019-04-07T10:23:17.659732Z"
  },
  "done": true
}

После этого застряли на целый день. Транскрипция сделана, но как мне получить к ней доступ? Какую переменную я могу вызвать, чтобы увидеть результат? Как я могу сохранить его в файл? Кроме того, мне интересно, как лучше всего запускать скрипты Python в GCP.

Я видел этот ответ: Ответ API облачной речи Google: парсинг iOS но это подводит меня к очень фундаментальной проблеме, с которой я сталкиваюсь: как и где лучше всего выполнить этот код?

Я также пытался создать * .py файлы и chmod их, но есть ли более простой способ запуска простых скриптов?

Мой ожидаемый результат - окончательный текстовый файл или даже просто доступ к строке, которая находится за операциями: которую я получаю.

1 Ответ

0 голосов
/ 07 апреля 2019

У Google есть примеры в документации :

В оболочке вы можете запустить

curl -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
     -H "Content-Type: application/json; charset=utf-8" \
     "https://speech.googleapis.com/v1/operations/4983661747957213554"

Где 4983661747957213554 - это имя вашей операции, возвращенной выше. И он напечатает вам результаты:

{
  "name": "7612202767953098924",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "progressPercent": 100,
    "startTime": "2017-07-20T16:36:55.033650Z",
    "lastUpdateTime": "2017-07-20T16:37:17.158630Z"
  },
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeResponse",
    "results": [
      {
        "alternatives": [
          {
            "transcript": "okay so what am I doing here...(etc)...",
            "confidence": 0.96096134,
          }
        ]
      },
      {

В Python вы можете запустить демонстрационный скрипт .

...