Как добиться распознавания речи для определения маркеров выделения SAPI? - PullRequest
0 голосов
/ 21 мая 2019

Можно извлечь фонемы по умолчанию для данного слова через SAPI:

  1. Голосовое слово с преобразованием текста в речь и сохранением вывода в формате .wav
  2. Используйте .wav в качестве входных данных для распознавания речи
  3. При распознавании слова извлеките фонемы из распознаваемые элементы фразы

Однако мне не удалось перехватить (если доступно) маркеры выделения («1» и «2» в таблице 1010 * American English Phoneme ). Есть ли способ сделать это?

РЕДАКТИРОВАТЬ: Вот что я пытался сделать (не красиво, но функционально). К сожалению, похоже, что SpeechVisemeFeature всегда показывает «SVF_None», даже когда я вручную добавляю акцент к слову с помощью Модификация речевого словаря SAPI. Кто-нибудь знает, почему это так?

using System;
using System.Threading;
using SpeechLib;
using System.Windows.Forms;

namespace PhoneEmphasis
{
    class Program
    {
        static string myWord = "hello";
        static SpPhoneConverter c = new SpPhoneConverter();
        static Thread t = null;

        static void Main(string[] args)
        {
            c.LanguageId = 1033;
            t = new Thread(test);
            t.Start();
            t.Join();
            Console.WriteLine("done");
            Console.ReadLine();
        }

        private static void test()
        {
            SpVoice v = new SpVoice();
            //v.EventInterests = SpeechVoiceEvents.;
            v.Phoneme += new _ISpeechVoiceEvents_PhonemeEventHandler(Phoneme_Handler);
            v.EndStream += new _ISpeechVoiceEvents_EndStreamEventHandler(EndStream_Handler);
            v.Speak(myWord, SpeechVoiceSpeakFlags.SVSFlagsAsync);
            Application.Run();
        }

        private static void Phoneme_Handler(int StreamNumber, object StreamPosition, int Duration, short NextPhoneId, SpeechVisemeFeature Feature, short CurrentPhoneId)
        {
            Console.WriteLine("Phoneme = " + c.IdToPhone(CurrentPhoneId).ToString() + " , VisemeFeature = " + Feature.ToString());
        }

        private static void EndStream_Handler(int StreamNumber, object StreamPosition)
        {
            Console.WriteLine("end stream!");
            t.Abort();
        }
    }
}
...