Я работаю над известным "Text To Speech" JavaScript SpeechSynthesis API. Я обнаружил 2 голоса Microsoft, установленных на моем «Windows 10», и около 10 голосов от Google. все они выглядят как роботы c голоса. Я пытался настроить скорость и высоту звука, но ни один из них не помог приблизить их к человеческому голосу.
Я также заметил, что SpeechSynthesis API требует, чтобы пользователи установили некоторые голоса на собственном устройстве, чтобы заставить API работать.
Мой вопрос:
- Можем ли мы сделать голоса ближе к человеческому голосу?
- Есть ли альтернатива SpeechSynthesis, чтобы использовать один красивый голос через устройства, например, мы устанавливаем голос на сервере и используем его для воспроизведения звука?
ниже приведен пример кода.
var synth = window.speechSynthesis;
var voices = synth.getVoices();
var utterThis = new SpeechSynthesisUtterance('Hello World. Please speak this dummy text');
utterThis.voice = voices[0]; // <-- try with any random voice
utterThis.pitch = 0.8;
utterThis.rate = 0.7;
utterThis.volume = 1;
synth.speak(utterThis);
Список голосов, извлеченных getVoices()
![enter image description here](https://i.stack.imgur.com/zliOe.png)
Интерфейс интерфейса для настройки скорости и высоты тона и т. Д. c
![enter image description here](https://i.stack.imgur.com/c7dg2.png)