Большой словарный запас распознавания речи в iPhone без интернета? - PullRequest
3 голосов
/ 21 июля 2011

Я использовал Openears, который нуждается в словаре.Это полезно, когда мы упоминаем слово в словаре.Я хотел преобразовать все слова, которые мы говорим.Поэтому я использовал речь Нюанса для распознавания Dragaon SDK.Но он общается с веб-сервером.Я хочу избежать взаимодействия с сервером из-за проблем безопасности.Можно ли преобразовать речь в текст для всех слов, которые мы говорим, как это происходит в Windows Mobile, без связи с сервером только в автономном режиме?

Ответы [ 3 ]

3 голосов
/ 22 июля 2011

Распознавание речи с неограниченным словарным запасом требует очень больших вычислительных ресурсов и ресурсов памяти (гигабайт памяти), и, таким образом, это очень трудно сделать в iPhone на другом встроенном устройстве.iPhone в 9 раз медленнее, чем настольный.iPad проще, поскольку у него более мощный процессор.

Google приложил очень большие усилия, чтобы заставить их движок работать в автономном режиме для диктовки, и все же он предпочитает отправлять данные на сервер, потому что он значительно более точен.

Из-за этого большинство решений, работающих на небольших устройствах, используют ограниченный словарный запас.Хотя этот словарь может быть достаточно большим, поэтому вы этого не заметите.Обычно 500-1000 слов достаточно, чтобы охватить большинство практических ситуаций.Вы можете использовать OpenEars для распознавания такого словаря.

Для обучения языковой модели вам нужны тексты из вашего домена (слова и выражения).Языковая модель обучения описана в CMUSphinx tutorial .Для использования языковой модели вы можете использовать следующий вызов API OpenEars:

- (void) changeLanguageModelToFile:     (NSString *)    languageModelPathAsString
withDictionary:     (NSString *)    dictionaryPathAsString 

См. Справочник по API для получения более подробной информации.

Вы можете использовать OpenEars с таким словарем и соответствующимиязыковая модель для поддержки ввода текста в свободной форме для вашего устройства.

1 голос
/ 21 июля 2011

Это можно сделать, но если вы ищете неограниченный словарный запас для преобразования текста в текст, то лучше всего, если вычисления будут выполнены на сервере. Требования к такой системе, вероятно, слишком велики для такой системы, как смартфон. Основные области, в которых вы будете предъявлять огромные требования:

  1. Словарь для отображения входной речи в текст.
  2. Вычисления для запуска алгоритмов распознавания речи.

Я считаю, что именно по этой причине такие компании, как Google, запускают свои службы распознавания речи через сервер, а не по телефону.

Но если приложение представляет собой ограниченную речь в тексте, то, возможно, стоит попробовать.

Всего наилучшего!

0 голосов
/ 21 июля 2011

Не работает ли pocketsphinx на iPhone без подключения к сети? Разве нет демо-приложений, таких как VocalKit

http://www.rajeevan.co.uk/pocketsphinx_in_iphone/ может быть полезным.

...