Измерения расстояния / подобия для мультимедиа - GAN и гибридный набор данных - PullRequest
0 голосов
/ 25 июня 2019

Прямо в точку: Существуют ли какие-либо ресурсы для измерения «расстояния» или сходства между двумя разными изображениями или двумя разными аудиосэмплами?

Справочная информация: Я заинтересован в экспериментах с GAN и хотел использовать гибридный набор входных данных. Например, используя изображения геометрического абстрактного искусства с изображениями картин эпохи Возрождения. Цель состоит в том, чтобы создать изображения, которые объединяют оба стиля.

Я еще не проводил никаких экспериментов, но, читая о других работах с GAN, кажется, что чем больше схожи данные, тем лучше результаты. Например, генерировать музыку. Если все аудиосэмплы принадлежат к одному и тому же жанру (например, классическое фортепиано), имеют некоторую временную подпись (например, время 4/4) и в одном ключе (например, до мажор), вывод из GAN будет лучше. Таким образом, у меня остается вопрос: «Насколько похожи (или могут быть отдаленными) данные, и все же дают субъективно хороший результат?» и «Как я могу измерить это сходство / расстояние?».

...