Очень легко - зайдите в звуковой микшер, выберите вход и включите / включите «Stereo Mix». Вы, конечно, должны выключить микрофон, если не хотите записывать это тоже. Затем просто начните запись так же, как вы записали микрофон - теперь вы получите тот же канал, что и динамики в цифровом качестве.
Это может быть сделано программно , хотя это может быть непросто - особенно если вы хотите поддерживать WinXP, а также Vista / Win7 (Звук был переработан в Vista, и я считаю, что API значительно отличаются хотя мне еще не приходилось их использовать).
Вам почти наверняка понадобится отфильтровать звук перед попыткой распознавания. Если речь не распознается. Библиотека, которую вы используете, предназначена для работы в неблагоприятных условиях, музыка и спецэффекты будут мешать правильному распознаванию, как и несколько человек, говорящих одновременно.
Если у вас нет сверхнадежной библиотеки, фильтры для ослабления не вокальных частот будут обязательными. Вам также может понадобиться применить нормализацию громкости для учета громких / тихих сцен. Существуют сотни фильтров, которые потенциально могут улучшить соответствие.
Возможно, вы захотите получить доступ к API распознавания на самом низком уровне, чтобы получить как можно больше контроля - вам нужно настроить его, чтобы справиться с криками людей, задыханием, плачем и т. Д. Если вы начнете разрабатывать для гибкого подхода Низкоуровневый доступ, он, вероятно, сэкономит вам недели, если вы обнаружите, что он вам нужен позже, и вам придется перепроектировать.
Я бы посоветовал вам взглянуть на NAudio в качестве отправной точки для обработки звука
Я подозреваю, что вы сможете получить что-то, что будет работать в идеальных условиях без особых усилий, но настроить его, чтобы он работал хорошо во всех случаях, может быть огромной задачей. Тем не менее, это звучит как забавный проект.
Вы можете значительно повысить вероятность распознавания, создав словари для жанров, пользователей или шоу. Они могут быть либо предварительно сгенерированы, либо построены автоматически с использованием взвешенной петли обратной связи - возможно, также позволяя пользователю исправлять ошибки.