Я пишу приложение, которое будет вести себя подобно существующему распознаванию голоса, но будет отправлять звуковые данные в запатентованный веб-сервис для выполнения части распознавания речи.Я использую стандартный MediaRecord (который закодирован в AMR-NB), который идеально подходит для распознавания речи.Единственные данные, предоставленные этим, - это Amplitude с помощью метода getMaxAmplitude () .
Я пытаюсь определить, когда человек начинает говорить, чтобы когда человек перестал говорить в течение примерно 2 секундЯ могу приступить к отправке звуковых данных в веб-сервис.Прямо сейчас я использую порог для амплитуды, который, если он превышает значение (то есть 1500), то я предполагаю, что человек говорит.Меня беспокоит то, что уровни амплитуды могут варьироваться в зависимости от устройства (например, Nexus One v Droid), поэтому я ищу более стандартный подход к этому, который можно получить из значений амплитуды.
PS Я смотрел на графическая амплитуда , но это не дает возможности сделать это только с помощью амплитуды.