Я новичок в ML, поэтому у меня очень простой вопрос. Я был бы признателен, если бы кто-то разъяснил мне это.
Предположим, у меня есть набор твитов, которые помечены как отрицательные и положительные. Я хочу провести некоторый анализ настроений.
Я извлек 3 основных c функции:
- Эмоциональные иконки
- Восклицательные знаки
- Интенсивность слов (очень, действительно эт c .).
Как использовать эти функции с SVM или другими алгоритмами ML?
Другими словами, как развернуть извлеченные функции в алгоритме SVM? Я работаю с python и уже знаю, как мне запустить SVM или другие алгоритмы, но я понятия не имею о связи между извлеченными функциями и их ролью в каждом алгоритме!
Основываясь на ответах некоторых экспертов, я обновляю свой вопрос:
Сначала я хочу оценить ваше время и достойные объяснения. Я думаю, что моя проблема решается ... Итак, в соответствии с тем, что вы сказали, каждому алгоритму ML могут потребоваться некоторые векторизованные функции, и я должен найти способ представить свои функции как векторы. Я хочу объяснить, что я получил из вашего объяснения, в зачаточном примере.
Скажем, у меня значки смайликов (например, 3 значка) как одна особенность:
1 - следовательно, я должен представлять это особенность вектора с 3 значениями.
2-Векторизованная функция может начинаться следующим образом: [0,0,0] (каждое значение представляет значок = :) и :( и: P).
3-Далее я должен go просмотреть каждый твит и проверить, есть ли в твите значок или нет. Например, [2,1,0] показывает, что твит имеет: :) 2 раза, и :( 1 раз, и: p нет времени.
4-После того, как я проверю все твиты, у меня будет большой вектор с размером n * 3 (n - общее количество моих твитов).
5-этапы 1-4 должны быть сделаны для других функций.
6-тогда я должен объедините все эти функции, используя m моделей SVM (m - это число моих функций), а затем классифицируйте их большинством голосов или каким-либо другим способом или создайте длинный вектор, объединив все векторы, и подайте его в SVM.
Не могли бы вы исправить меня, если есть какое-то недопонимание? Если оно неверно, я его удалю, иначе я должен оставить его, потому что это может быть практичным для любого новичка, такого как я ... Спасибо большое ...