Как справиться с сопоставлением двух немаркированных наборов данных - PullRequest
0 голосов
/ 14 мая 2019

У меня есть два разных массива данных, один из которых представляет собой массив значений серого (0-255) с размером (N, 784).Другой - это массив со значениями MFCC, которые являются вложенными массивами с переменной длиной и 13 значениями каждый.

Кроме того, данные поезда и теста не помечены, и мне нужно разработать модель, чтобы увидеть, являются ли данные изображения и аудиоданныеопишите тот же объект.Единственный показатель, который у меня есть, - это логический массив, который сообщает мне, соответствуют ли данные тренировочного образа тренировочным аудиоданным или нет.

Я не совсем уверен, как решить эту проблему, так как пока у меня есть толькостроить модели на единичных наборах данных.То, что я пробовал до сих пор:

Сложение всех данных вместе, нормализация и заполнение переменной длины MFCC нулями, а затем использование логических значений в качестве меток в MLP.

Удалены все ложныезаписей из набора данных и использования массива градаций серого в качестве меток в CNN.

Полагаю, я не совсем уверен, что на самом деле пытаюсь решить, и просто цепляюсь за вещи.Я определенно не ищу никаких примеров кодирования, но больше для общего направления, в котором можно направить мои поиски в Google.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...