Как реализовать «Идентификацию» речи в Javascript (или Flask WebApp)? - PullRequest
0 голосов
/ 16 января 2020

Мне нужно было реализовать «идентификацию» речи, ie. Угадай, если человек, который пытается войти в систему, на самом деле он / она, сопоставив его / ее голос . Чтобы рассмотреть случай, когда приложение не распознает человека, но пользователь сам пытается войти в систему, он может обойти его с помощью булавки, настройка во время начальных настроек.

Я использую Python и Flask, чтобы построить веб-приложение, и включил javascript в вопрос, чтобы также знать возможные пути в нем. До сих пор я читал об этом из некоторых источников, но не смог найти возможного решения о переполнении стека, а также о «нескольких» сообщениях в блоге.

Лучшее «возможное» решение, которое я мог бы найти Это была Cognitive Speech Services от Microsoft - https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/

Я также думал о записи голоса с помощью устройства записи. js и анализе на стороне сервера, но не смог реализовать it.

Итак, я хотел найти способ реализовать его в веб-приложении, даже простую суть с небольшим количеством кода по использованию служб MS Cognitive (я читал страницы документации, но это не сильно помогало). ), или делать это по python будет полезно.

Ответы [ 2 ]

0 голосов
/ 24 января 2020

Как @Ram указал, что мы можем использовать Microsoft Cognitive Services, мы использовали то же самое для его реализации.

Во-первых, нам нужен был ключ API от Microsoft для Cognitive Speech Service (они дают 2 ключи и конечная точка на 7 дней в бесплатной пробной версии, без какой-либо карты, и еще одна бесплатная версия на год, возможно, с данными карты). Получите ключи API здесь: https://azure.microsoft.com/en-in/try/cognitive-services/?unauthorized=1

* 1007 Затем я просмотрел документацию Microsoft, но на самом деле это мне не помогло. Помогло следующее: https://github.com/rposbo/speaker-recognition-api

Я просмотрел все файлы, и «необходимая» часть была в основном в распознавании речи-api-demo-core. js и демо. html Сначала поймите, что он на самом деле делает, затем только вы можете реализовать это на своей странице. Это фактически завершает ответ, так как это «может» быть реализовано с использованием Javascript. Дополнительно - https://github.com/AdityaGupta150/ProtoMain - Мы использовали только необходимую часть кода Робина Посбо (вы не сможете просто скопировать вставку, сначала ее поняли), и реализовали ее, вы можете увидеть это в шаблонах /verification.html

0 голосов
/ 23 января 2020

Будет полезна документация на https://docs.microsoft.com/en-us/azure/cognitive-services/speaker-recognition/home. Обратите внимание, что есть ссылки для перехода по ссылке API. Это объясняет процесс высокого уровня (используйте «регистрацию» для обучения).

У нас есть идентификатор говорящего , который отличает говорящего от группы известных голосов, с которыми вы тренируетесь. Вам необходимо предоставить помеченные данные (означающие примеры разговора известного оратора): см. https://westus.dev.cognitive.microsoft.com/docs/services/563309b6778daf02acc0a508/operations/5645c3271984551c84ec6797.

или Пожалуйста, следуйте ниже по ссылке образцы речи SDK. https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/

Вы можете использовать API пакетной транскрипции и включить диаризацию. https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

...