Я создал набор данных о различных фильмах, снятых за последние несколько лет, технические специалисты работали для фильма, жанра, страны, в которой он представлен, времени работы, языка, соответствующего кинофестиваля, который выиграл фильм, и т. Д. c.
набор данных похож на this , это файл Excel.
Меня интересует мульти-лейбльная классификация фильмов на кинофестивалях, основанная на неотъемлемых особенностях мов ie (независимо от сюжета)
Я думал, что нам нужно работать в числах / векторах для мульти-метки классифицировать данные. Но я не знаю, как можно провести векторизацию имен (имен собственных) и нескольких отдельных слов.
Есть ли какой-то другой способ, которым я могу выполнить процесс для достижения моей цели классификации по нескольким меткам? с вышеуказанными данными? Пожалуйста, помогите мне определить это. Спасибо.