Есть ли способ получить tf и idf для атрибута stopwords_ атрибута TlefidfVectorizer (не стоп-слов) sklearn?
Они уже рассчитаны, поэтому модель должна иметь эти значения, но кто-нибудь когда-либо использовал их?Если нет, то, наверное, мне придется взломать внутренний код и получить его самому, правильно?
[ОБНОВЛЕНИЕ]
Для тех, кто может оказаться в этом вопросе,В качестве обновления я в итоге взломал sklearn/feature_extraction/text.py
и экспортировал слова и значения в виде кортежей для класса CountVectorizer, а не просто для слов.