Использование Scikit-learn Pipeline против списка, добавленного в python - PullRequest
1 голос
/ 28 января 2020

Я хочу выполнить предварительную обработку текстовых данных, используя мою собственную функцию, а затем применить счетчик. Могу ли я использовать конвейер для этих двух работ?

1 Ответ

0 голосов
/ 28 января 2020

Да, вы можете. Scikit-learn имеет класс CountVectorizer, который является преобразователем, и вы можете создать преобразователь предварительной обработки текстовых данных, следуя scikit-learn API .

Этот красивый блог показывает, как построить собственный преобразователь и как использовать его в конвейере, следуйте ему.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...