У меня есть два разных массива данных, один из которых представляет собой массив значений серого (0-255) с размером (N, 784).Другой - это массив со значениями MFCC, которые являются вложенными массивами с переменной длиной и 13 значениями каждый.
Кроме того, данные поезда и теста не помечены, и мне нужно разработать модель, чтобы увидеть, являются ли данные изображения и аудиоданныеопишите тот же объект.Единственный показатель, который у меня есть, - это логический массив, который сообщает мне, соответствуют ли данные тренировочного образа тренировочным аудиоданным или нет.
Я не совсем уверен, как решить эту проблему, так как пока у меня есть толькостроить модели на единичных наборах данных.То, что я пробовал до сих пор:
Сложение всех данных вместе, нормализация и заполнение переменной длины MFCC нулями, а затем использование логических значений в качестве меток в MLP.
Удалены все ложныезаписей из набора данных и использования массива градаций серого в качестве меток в CNN.
Полагаю, я не совсем уверен, что на самом деле пытаюсь решить, и просто цепляюсь за вещи.Я определенно не ищу никаких примеров кодирования, но больше для общего направления, в котором можно направить мои поиски в Google.