Видео имеет большую задержку, чем аудио. Вот почему вы получаете аудио раньше. Поэтому вам нужно будет обрезать файл потом, если вы этого не хотите. Или вы добавляете в свой код логи c, которые отбрасывают все аудио до тех пор, пока не будет декодировано первое видео.