Проверенным методом создания таких субъективных высокоуровневых функций является создание большого маркированного набора данных, а затем обучение оценщиков с использованием контролируемого обучения.
Кто-то должен собрать эти данные с нуля. Обычно люди слушают много песен и оценивают их по каждой функции. Нужно, чтобы несколько человек слушали каждую песню, чтобы установить, в какой степени люди согласны или нет относительно «правильной» ценности. Это очень трудоемкий шаг, так как в таком наборе данных нужно было бы тысячи разных песен. Если и вы, и Spotify проделали основательную работу, теоретически результаты должны иметь достаточное количество соглашений.
В идеале, существовал бы открытый набор данных с такими аннотациями. Вы можете спросить об этом в Open Data Stack Exchange.
Хитрость заключается в том, чтобы использовать существующий оценщик, такой как Spotify, «оракул» для создания маркированного набора данных. В основном выберите несколько звуковых дорожек, используйте их API, чтобы получить соответствующие высокоуровневые значения объектов, и обработайте их как метки наземной правды.
Обратите внимание, что это своего рода обратный инжиниринг, и что этот может нарушать их Условия обслуживания . Поэтому обязательно проверьте это, прежде чем продолжить.