Получение NameError: имя 'countVectorizer' не определено в Pycharm - PullRequest
0 голосов
/ 03 октября 2018

Нужна помощь с ошибкой NameError: имя 'countVectorizer' не определено в PyCharm

Я пытаюсь выполнить код извлечения FEATURE из этого источника https://github.com/chdoig/pytexas2015-ml

Имя файла: 1-Feature_extraction.ipynb

import numpy as np
import pandas as pd


train_data = pd.read_csv('labeledTrainData.tsv',sep='\t')
print(train_data)
print(train_data.iloc[1].review)

test_data = pd.read_csv('testData.tsv',sep = '\t')
print(test_data)

import matplotlib.pyplot as plt
import seaborn as sns

train_data['review_len'] = train_data.review.apply(len)
len_pl = plt.hist(train_data.review_len.values)
plt.show(len_pl)

#describe negative reviews
print(train_data[train_data.sentiment==0].describe())
print(train_data[train_data.sentiment==1].describe())

#inspecting outliers
print(train_data[train_data.review_len==52].review.all())
print(train_data[train_data.review_len==13708].review.all())

#word exrtaction

from sklearn.feature_extraction.text import CountVectorizer

vocab = ['awesome', 'terrible']
simple_vectorizer = countVectorizer(vocabulary=vocab)
bow = simple_vectorizer.fit_transform(train_data.review).todense()
print(bow)

Ошибка / предупреждение: C: \ Users \ hi \ PycharmProjects \ Practice2 \ venv \ Scripts \ python.exe C: / Users / hi / PycharmProjects /Practice2 / P1.py C: \ Users \ hi \ PycharmProjects \ Practice2 \ venv \ lib \ site-packages \ sklearn \ externals \ joblib \ externals \ cloudpickle \ cloudpickle.py: 47: Предупреждение об устаревании: модуль imp устарел в пользуimportlib;см. документацию модуля для альтернативного использования import imp Traceback (последний вызов был последним): файл «C: /Users/hi/PycharmProjects/Practice2/P1.py», строка 32, в simple_vectorizer = countVectorizer (vocabulary = vocab) NameError: name'countVectorizer' не определен

Процесс завершен с кодом выхода 1

1 Ответ

0 голосов
/ 03 октября 2018

Вы импортируете CountVectorizer , но ссылаетесь на countVectorizer .

...