Использование только векторизатора счета - PullRequest
0 голосов
/ 23 января 2019

Я получаю те же результаты при использовании любого из 2-х векторизаторов:

vect=CountVectorizer(min_df=1,  token_pattern=r'[a-zA-Z0-9\-\ ]+')
vX = vect.fit_transform(movies['genres'])
df3=pd.DataFrame(vX.toarray(), columns=vect.get_feature_names())

Есть ли случаи, когда мне «придется» использовать Binary Analyzer вместо счетчика векторов?

mlb = MultiLabelBinarizer()
mym=mlb.fit_transform(movies['genres'].str.split('|'))
ndf2=pd.DataFrame(mym, columns=mlb.classes_)

Или есть разница в df3 и ndf2, которую я мог пропустить? У меня вопрос, могу ли я использовать только граф Vectroizer?

...