sklearn TtfidfVectorizer stopwords_ - PullRequest
0 голосов
/ 10 июня 2018

Есть ли способ получить tf и idf для атрибута stopwords_ атрибута TlefidfVectorizer (не стоп-слов) sklearn?

Они уже рассчитаны, поэтому модель должна иметь эти значения, но кто-нибудь когда-либо использовал их?Если нет, то, наверное, мне придется взломать внутренний код и получить его самому, правильно?

[ОБНОВЛЕНИЕ]

Для тех, кто может оказаться в этом вопросе,В качестве обновления я в итоге взломал sklearn/feature_extraction/text.py и экспортировал слова и значения в виде кортежей для класса CountVectorizer, а не просто для слов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...