Это может быть ОЧЕНЬ сложно. Формат файла MP4 включает атом «moov», который имеет указатели на «сэмплы» аудио и видео. Если у вашего файла mp4 нет атома moov, ваша работа будет намного сложнее. Вам нужно было бы разработать логику для изучения атома mdat (который содержит все аудио и видео образцы) и использовать образованные догадки, чтобы найти границы аудио и видео.
Еще хуже, без атома moov у вас не будет SPS и PPS, необходимых для декодирования срезов. Вы должны были бы синтезировать замены; если вы знаете кодек, использованный для создания MP4, то вы можете скопировать SPS и PPS из файла с одинаковым кодированием; в противном случае это может быть болезненный процесс проб и ошибок, поскольку синтаксис срезов (изображения в кодировке H.264) зависит от значений, указанных в SPS и PPS.