Мне нужно знать точное местоположение таймфрейма из видео, используя небольшую часть аудио. Я предпочитаю использовать внешний API, используя решения Google, Amazon или Microsoft Voice / Audio. Кто-нибудь знает, что я могу использовать? спасибо.