О ваших первых 3 вопросах:
Вам не нужно сравнивать временные метки между словами, вы можете определить, является ли слово частью полного высказывания (конечного результата), посмотрев на is_final flag
в Результат распознавания потоковой передачи . Если флаг установлен в true, ответ соответствует завершенной транскрипции, в противном случае это промежуточный результат. Подробнее об этом здесь .
Как только вы получите окончательные результаты, никакие промежуточные результаты не должны генерироваться до тех пор, пока не появятся новые высказывания.
Что касается вашего последнего вопроса, вы не можете превысить 1-минутный лимит, вам нужно вместо этого отправить несколько запросов .