Как преобразовать темы для каждого элемента в наборе данных в вектор объектов, учитывая, что каждый элемент может иметь более 1 темы - PullRequest
1 голос
/ 23 февраля 2020

У меня есть набор данных, который содержит операторы engli sh. Каждому утверждению был назначен ряд тем, о которых говорится в заявлении. Темами могут быть экономика, спорт, политика, бизнес, наука и т. Д. c. Каждое утверждение может иметь более 1 топи c. Некоторые утверждения могут иметь 1 топи c, некоторые могут иметь 2 темы и т. Д. И т. Д. Для самого оператора я использую векторы TF-IDF для преобразования оператора в вектор признаков. Однако я не совсем понимаю, как преобразовать темы в вектор функций для обучения машинному обучению.

1 Ответ

0 голосов
/ 23 февраля 2020

Вы можете создать двоичный столбец для каждого topi c, который будет показывать, имеет ли оператор этот topi c.

...