Преобразователь текста в речь - PullRequest
4 голосов
/ 01 июля 2011

Я собираюсь создать конвертер текста в речь, который может выполняться как в Windows, так и в системах на основе Linux. Может кто-нибудь, пожалуйста, помогите мне ответить на следующие вопросы;

  1. Какой язык мне использовать; Java, C ++ или любой другой?
  2. Программа, которую я собираюсь создать, должна быть способна читать большие куски данных.
  3. Должно быть хорошее качество звука.
  4. Какие библиотеки доступны для этого?

Пожалуйста, поделитесь своим опытом.

Ответы [ 4 ]

6 голосов
/ 01 июля 2011
  1. Используйте язык, который вам наиболее удобен. Я усвоил трудный путь, когда попытался перекодировать мой raytracer на C ++, исходя из фона Python. Мне потребовались недели, чтобы заставить его функционировать ...

    По сути, вы будете разочарованы нюансами нового языка, прежде чем сможете приступить к кодированию чего-либо, поэтому я предлагаю вам придерживаться того, что вы знаете.

  2. Это не зависит от языка. Просто убедитесь, что данные читаются кусками (например, 2048 килобайт за раз). Чтение большого файла в ОЗУ не является хорошей идеей, так как вы не можете быть уверены, что у вашего конечного пользователя достаточно ОЗУ (аудиофайлы могут получить БОЛЬШОЙ).

  3. Это тривиально. Я не могу помочь вам запрограммировать хорошее качество звука. Это зависит от вас.

  4. Существует несколько реализаций TTS для Linux, поэтому это все, что я могу порекомендовать. Посмотрите на Фестиваль , так как это один из тех, которые вы действительно можете понять.

3 голосов
/ 01 июля 2011

Давным-давно у меня была та же идея.Я думаю, что это не слишком сложно и может быть сделано.Вот как я бы это сделал:

1- Я бы использовал Java, потому что он не зависит от платформы.

2- Если высобираясь создать отдельное приложение, это будет локальный компьютер, который будет выполнять обработку, а не сервер приложений, как в случае веб-приложений.Также я предполагаю, что ваша программа будет использоваться только одним пользователем одновременно.Я думаю, что у вас не будет больших проблем с количеством данных для обработки, если вы реализуете какой-то механизм буферизации.при записи, форматировании, скорости звука ... Обратите внимание, что во многих приложениях преобразования текста в речь, которые существуют в сети, качество звука в порядке, но вы никогда не почувствуете, что это настоящий человек, который читает.(Я рекомендую вам женский голос, он звучит лучше).

4- Что касается библиотек и других гаджетов, думаю, вам может понадобиться:

-Java Standard Development Kit (чтобы иметь возможность работать с Java)

-Хорошая IDE: Есть много, которые вы можете получить бесплатно.Мой любимый eclipse , но если вы новичок в Java, вы можете начать с netbeans , многие говорят, что он более интуитивно понятен для обучения.

- Библиотека JLayer Mp3 Это поможет вам воспроизводить звуки в java.

- javax.swing Это библиотека java, которая входит в комплект разработчика и позволяет создаватьбогатые графические пользовательские интерфейсы.Также, если вы новичок в свинге, я бы порекомендовал вам отличную IDE для свинга, которая называется JFormDesigner , взгляните на нее, я уверен, что это значительно ускорит вашу разработку (это отличный инструмент).

Я надеюсь, что мои ответы могут дать вам несколько советов.

Обновление

Я думаю, что было бы правильно также упомянуть, что единственным минимальным требованием пользователейвашего приложения будет иметь для того, чтобы запустить приложение:

JRE (среда выполнения Java)

1 голос
/ 30 марта 2012

Этот проект преобразования текста в речь может быть выполнен с использованием компьютерного голоса, поэтому нет проблем с сохранением базы данных для каждого слова и его произношения.Просто используйте язык, на котором вы чувствуете себя мастером, и примените концепцию .....

0 голосов
/ 01 июля 2011

Я ничего не знаю о преобразовании текста в речь, кроме того, что это нелегко. При этом я предлагаю вам придерживаться языка, с которым вы наиболее знакомы. Я уверен, что Java и C могут это сделать.

...