Если API Google Speech транскрибирует звук практически в режиме реального времени, а моя задержка для фактического сервера составляет всего 50 мс, почему я получаю мой окончательный результат транскрипции через 1,6 с?Разве я не должен получить его всего за пару сотен миллисекунд?