Как обучить наивного байесовского классификатора в НЛТК на разных корпусах? - PullRequest
0 голосов
/ 12 мая 2018

Я хочу использовать textblob для анализа настроений для финансовых новостей.Но при использовании TextBlob("news text", analyzer=NaiveBayesAnalyzer())).

Я очень плохо знаком с Python, но, по некоторым сведениям, в приведенной выше строке используется предварительно обученный Наивный байесовский классификатор, обученный по корпусу рецензий на фильмы.Существует множество других корпусов, доступных по адресу http://www.nltk.org/nltk_data/.. Мне кажется, что корпус обзоров фильмов может не подойти для анализа настроений финансовых новостей.Некоторые слова могут иметь разную полярность и вес при использовании в другом контексте.Что мне делать, если я хочу использовать Reuters?Есть ли какая-либо предварительно обученная модель, уже доступная или каким-либо другим способом, которым я могу использовать ее, поскольку вышеупомянутая использует корпус обзоров фильмов?

Если нет, то как мне его тренировать и сколько времени это займет?Я новичок в Python и понятия не имею, сколько времени / памяти / вычислительной мощности это займет.

...