Хорошо, это немного сложно.На самом деле нет лучшего пути к этому с ruby, но здесь все сказано.
Лучший вариант, который я могу придумать, - это обернуть внешний вызов для вызова ffmpeg для выполнения преобразования.Как то так:
source_video = params[:video_file]
%x[ffmpeg -i #{source_video} -vn -ar 44100 -ac 2 -ab 192 -f mp3 sound.mp3]