Библиотеки аудиосэмплов (разговорный текст) - PullRequest
0 голосов
/ 27 сентября 2008

Для проекта, над которым мы сейчас работаем, нам нужна библиотека произнесенных слов на разных языках.

Возможны два варианта: преобразование текста в речь или «реальная» запись носителями языка. Поскольку качество важно для нас, мы думаем идти по последнему пути.

Чтобы создать прототип для нашего приложения, мы ищем библиотеки, которые содержат как можно больше слов на разных языках. Чтобы почувствовать качество нашего подхода, эта библиотека не должна состоять из синтезированной речи.

Вам известны какие-либо доступные / доступные библиотеки?

Ответы [ 5 ]

3 голосов
/ 27 сентября 2008

Сотрудник только что нашел эту библиотеку, основанную на сообществе, которая хороша, но довольно мала по размеру:

Forvo.com

0 голосов
/ 19 августа 2018

Один я использую, чтобы использовать много: http://shtooka.net/index.php Легкий доступ к записям.

0 голосов
/ 27 сентября 2008

Я предполагаю, что вы нигде не найдете библиотеку, состоящую только из отдельных слов. Что бы вы ни нашли, вам придется открыть аудио в редакторе (например, Pro Tools или Cool Edit) и разделить его на отдельные слова.

Возможно, вам лучше создать список всех слов, которые вам нужны для каждого языка, а затем найти носителей, которые будут читать их во время записи. Вы можете читать их медленно, так что вам будет легко рубить каждое отдельное слово.

0 голосов
/ 27 сентября 2008

Существует также Старое время радио , хотя и не уверен, что вы говорите именно такое слово.

0 голосов
/ 27 сентября 2008

Я только что нашел это в вики Audacity : VoxForge . С их сайта:

VoxForge был настроен для сбора транскрибированной речи для использования с бесплатными и открытыми двигателями распознавания речи (в Linux, Windows и Mac).

Мы сделаем доступными все предоставленные аудиофайлы по лицензии GPL, а затем «скомпилируем» их в акустические модели для использования с механизмами распознавания речи с открытым исходным кодом, такими как Sphinx, ISIP, Julius и HTK (примечание: HTK имеет ограничения на распространение) ,

...