Существует ли библиотека / утилита .NET, которая преобразует документ Word в формат MP3? - PullRequest
4 голосов
/ 10 июня 2010

Кто-нибудь знает какие-либо хорошо поддерживаемые / проверенные методы для преобразования документа Microsoft Word в формат MP3 или WAV, чтобы люди с нарушениями слуха могли «прослушивать» документы, которые я сохранил в своей веб-системе управления документами?

У меня уже есть интерфейс, созданный таким образом, что кто-то может использовать телефон, чтобы получить список доступных документов, с датами и заголовками, «прочитанными» им по телефону, но теперь я хотел бы иметь возможностьпусть кто-то на самом деле слушает содержимое файлов Word, хранящихся в системе.

В идеале .NET библиотека или утилита, которые позволили бы мне конвертировать DOC -> MP3 после каждой загрузки, будет лучше, но тот, который "читает"файл по требованию тоже подойдет.

Ответы [ 5 ]

4 голосов
/ 12 июня 2010

Вы можете использовать System.Speech.Recognition для настройки вашего механизма TTS и пространство имен System.Speech.Synthesis для записи / сохранения (сохраняет в .WAV).В System.Speech.AudioFormat вы можете настроить параметры вывода файла WAV.Для Word вы можете просто использовать COM Interop , чтобы захватить файл, открыть его и получить текст в любом виде, который вам нужен, и передать его в управляемый SAPI.Вероятно, я бы разделил вещи на параграфы / прогоны, таблицы, ссылки и прочее.

Если вы ищете гораздо более надежную технологию, одним из наиболее известных механизмов TTS является Сервер NaturallySpeakingSDK - недавно они добавили функцию «Audio Streaming», которая позволяет TTS «на лету», поэтому нет необходимости в предварительной записи в постоянный аудиофайл (но если вы хотите, он также можетпредварительная запись).Вы также можете проверить их AudioMining SDK , который обеспечивает полную индексацию и возможность поиска произносимого текста в аудиофайлах.Все их SDK - это COM, а не .NET.

2 голосов
/ 17 июня 2010

Если ваш документ Word хранится в новом формате OpenXML, представленном в Office 2007, возможно, вы захотите взглянуть на набор инструментов Daisy.

В SourceForge доступен бесплатный конвертер для создания файла Daisy из вашего документа Word. Формат Daisy понятен программам чтения с экрана, и есть также конвертеры для преобразования файла Daisy в аудиофайл.

Подробнее см .:

2 голосов
/ 10 июня 2010

Получение текста из Word - самая легкая часть. Есть несколько доступных библиотек tts, но обычно они дорогие. Acapela (http://www.acapela -group.com ), вероятно, лучший из всех, что я нашел, и API поддерживает вывод в звуковые файлы. Я не уверен, что MP3 поддерживается, но преобразование звуковых форматов тривиально.

Желаем удачи.

1 голос
/ 10 июня 2010

Возможно, я бы использовал mintext версию командной строки, чтобы сначала преобразовать файл .doc в текст, а затем сохранить этот текст в вашей базе данных (возможно, при загрузке?)Библиотека преобразования текста в речь для преобразования и сохранения этого файла, возможно, со ссылочным идентификатором, который связывает этот файл в базе данных.

1 голос
/ 10 июня 2010

Вы можете попробовать Panopreter , у него есть бесплатная и профессиональная версия.Я использовал его раньше с довольно хорошим успехом.

Я не уверен, что бесплатная версия может быть сохранена непосредственно в mp3, но вы всегда можете использовать другую программу для записи вывода в mp3.

...