Оказывается, я использовал странную версию ffmpeg, которая конвертировала обложку в h264. Использование официального бинарного релиза и добавление -codec copy
устранило проблему.
ffmpeg -i input.m4a -codec copy -acodec alac -sample_fmt s16p output.m4a