Использование нескольких столбцов текста в качестве функций для классификации нескольких классов - PullRequest
0 голосов
/ 10 января 2019

У меня есть набор данных, содержащий несколько текстовых столбцов, которые я должен использовать как функции для модели машинного обучения для мультиклассовой классификации.

например.

функция (весь текст) цель (текстовые классы)

feature1 feature2 feature3 feature4 -- target1

Может кто-нибудь подсказать, как подготовить функции для ввода и каков будет наилучший подход для получения максимальной точности, и, если возможно, поделитесь примером кода / ссылкой на код для справки, поскольку я не понимаю, как подойти к проблеме. ясно.

Это похоже на проблему классификации группы новостей.

1 Ответ

0 голосов
/ 10 января 2019

Предположим, у вас есть заголовки / абзацы новостей в качестве входных данных, вы хотите классифицировать их класс, например. политика, игры, бизнес. Обратите внимание, что одна новость может находиться под многими тегами.

Для этого вы можете выполнить поиск Моделирование темы , где целью является поиск категории / класса данных.

Эта ссылка даст хорошее представление об этой проблеме с различными классификаторами-2.

...