Этот код использует сахарензор, но я хочу использовать pytorch https://github.com/EN10/Speech-to-Text-WaveNet