Используя механизм преобразования текста в текст Google Cloud для транскрибирования иврита, он выводит данные в интерфейс командной строки, используя код Unicode (\ u05ea), а не буквы иврита (в данном случае 'ת').
Я запустил механизм транскрибирования из Cloud Tools for PowerShell следующим образом:
gcloud ml speech recognize-long-running 'gs://bizme/20190415.wav' --language-code='he-IL' --async
gcloud ml speech operations wait [run id]
Я ожидал, что секция вывода текста будет выводиться буквами на иврите (как это происходит, когда я просил его транскрибировать английский язык).текст), но фактический вывод был получен с использованием кодовых точек Unicode.
Например, это фактический вывод:
"transcript": "\u05d1\u05d5\u05e7\u05e8 \u05d8\u05d5\u05d1 \u05d7\u05d1\u05e8\u05d9\u05dd"
Инстант ожидаемого результата:
"transcript": "בוקר טוב חברים"
Как получить транскрипцию букв на иврите?