У меня есть аудиофайл, и у меня есть точная расшифровка этого аудиофайла. Я хотел бы иметь возможность получить временные метки каждого слова в этом конкретном c транскрипте.
I не требуются временные метки для неточной распознанной речи. Я уже могу это сделать, и это полезно, но это не совсем хорошо из-за ошибок в распознавании речи.
Кто-нибудь знает, возможно ли это с помощью распознавания речи Google?