Классификация текста с помощью предиктора тега переполнения стека word2ve c - PullRequest
0 голосов
/ 31 января 2020

Я работаю с предиктором тегов переполнения стека.

У меня есть датафрейм df, который содержит функцию 'post' и метку 'Tags', которая может иметь несколько ярлыков.

Мой df:

Tags    post

0   [php]   check upload file image without mime type woul...

1   [firefox]   prevent firefox close press ctrl-w favorite ed...

2   [r] r error invalid type list variable import matl...
3   [c#]    replace special character url probably simple ...

4   [php, api]  modify whois contact detail function modify mc...

... ... ...
179995  [delphi]    intraweb isapi module throw unrecognized comma...

179996  [c] opencv argc argv confusion check opencv tutori...

179997  [android]   list data sdcard want display file name reside...

179998  [java, email]   add sort extension imap server mail server sup...

179999  [linux, php]    create carddav ldap server share host via php ...

Поэтому я хочу использовать word2ve c для классификации и прогнозирования тегов.

Я хочу использовать все классификаторы машинного обучения, такие как SVM, random forest et c.

Мне также нужен отчет о классификации тегов.

Поэтому, пожалуйста, помогите мне.

1 Ответ

1 голос
/ 31 января 2020

word2ve c не является классификатором это преобразователь слов в вектор, мои предложения шаги 1) Предварительная обработка текста (например, стоп-слова и нормализация) 2) Преобразование слов в вектор с использованием TF-IDF или word2vec 3) Затем примените ml моделей (для мультиклассификации вы можете использовать SVM, Naive Bayes и Logisti c регрессия) 4) проверить результаты

...