Я работаю над моделью прогнозирования для музыкальной индустрии. Для этого у меня есть база данных, заполненная данными о множестве песен. Например, имя, продюсер или артисты. Моя проблема в том, что есть много данных со списками в качестве записей. Например, есть много песен с более чем одним исполнителем.
Я мог бы разделить эти записи, чтобы у меня было несколько столбцов для художников, но я не уверен, как обрабатывать все пустые строки. Когда в одной песне перечислено 5 исполнителей, но в большинстве песен только одна, у большинства будет четыре пустых столбца.
Это лучший способ справиться с этим? Я думал об ограничении всех песен только одним артистом, но имена артистов отсортированы в алфавитном порядке, поэтому я рискую удалить мега-звезду из песни, что, вероятно, сделает мой прогноз недействительным.
Так чтолучший способ обрабатывать пустые строки из-за точки данных, которая может иметь записи 1: n?