Вы, вероятно, не должны пытаться делать что-то особенное, даже если вы можете обнаружить, что работает программа чтения с экрана. Даже если вы правильно поняли это для одной группы пользователей программы чтения с экрана, вы можете ошибаться для другой группы. Лучше всего сосредоточиться на написании хорошего чистого HTML5.
Обратите внимание, что не все пользователи программы чтения с экрана используют преобразование текста в речь; многие используют вывод Брайля. Кроме того, другие типы инструментов специальных возможностей, такие как средства выделения содержимого и приложения голосового ввода, используют те же методы и API (например, DOM, MSAA), что и средства чтения с экрана, поэтому любой метод, «обнаруживающий средство чтения с экрана», вероятно, обнаружит и их. Вы не можете предполагать, что это означает, что пользователь полностью слеп и использует только речь.
В настоящее время аудио теги не являются общедоступными, разные браузеры имеют разные уровни поддержки доступности - см. HTML5 Accessibility и прокрутите вниз до аудио, чтобы узнать больше о текущей поддержке. Я видел несколько страниц, которые добавляют элементы управления на основе HTML5 плюс javascript после звукового тега, чтобы они могли предоставить свой собственный пользовательский интерфейс, чтобы пользователи клавиатуры или программы чтения с экрана могли воспроизводить / останавливать звук по мере необходимости. (В конце концов, когда браузеры догоняют, это не нужно).
Что касается общей доступности, то WCAG 2.0 ( Руководство по доступности веб-контента ) рекомендует, чтобы любой звук, который воспроизводился автоматически более 3 секунд, имел доступные средства для приостановки или остановки звука. (Я бы пошел еще дальше и рекомендовал бы не использовать какой-либо автоматический звук - при просмотре вкладок часто невозможно определить, с какой вкладки идет звук.)