Java Speech API технически ничего не делает, насколько я могу судить. Это интерфейс, который может реализовывать другое программное обеспечение. Я предлагаю использовать CMU Sphinx 4 , который является его реализацией. Он поставляется с большим количеством демонстраций и прост в установке, плюс есть полезные форумы и с открытым исходным кодом. Я не знаю, каков ваш проект, но если вы хотите реализовать действительно низкоуровневые вещи (например, свое собственное преобразование Фурье или что-то еще), вы можете реализовать API Sphinx DataProcessor и подключить его без создать всю систему самостоятельно. Тогда вы просто поместите свой класс в файл конфигурации, подобный этому:
<component name="frontEnd" type="edu.cmu.sphinx.frontend.FrontEnd">
<propertylist name="pipeline">
<item>microphone </item>
<item>premphasizer </item>
<item>windower </item>
<item>myfft </item>
<item>melFilterBank </item>
<item>dct </item>
<item>liveCMN </item>
<item>featureExtraction </item>
</propertylist>
</component>
<component name="myfft"
type="my.stuff.fastFourierTransform"/>
Если у вас есть код Matlab, вы можете преобразовать его в классы Java, используя this . Если у вас есть код cpp, который вы хотели бы использовать, вы можете использовать собственный интерфейс Java .