Вы не можете использовать API речевого ввода, поскольку он будет записывать только микрофон. Хорошо, вы можете подобрать динамики таким образом, но это явно не решение.
Использование плагина NPAPI - это решение. Вы можете определить звук, издаваемый определенной вкладкой и после записи этого источника, но он больше не является веб-разработчиком.