Я работаю над приложением для Android, таким как Google Transcribe Live, где я хочу реализовать преобразование речи в текст.Кто-нибудь может объяснить это, как это работает?