Question

Может кто-нибудь помочь с MRJob и Pymorphy2?Я новичок в Python и Hadoop.Я вроде понял, как выполнить токенизацию текста, но не могу понять, как морфологически разбирать получившиеся токены с помощью Pymorphy2.Может быть, я делаю что-то явно не так, но я не понимаю.Это мой код:

from mrjob.job import MRJob
import re, pymorphy2
morph = pymorphy2.MorphAnalyzer()
WORD_RE = re.compile(r"[\w']+")

     class MRMorphWord(MRJob):

        def mapper(self, _, line): 
            for word in WORD_RE.findall(line):            
                yield (word.lower(), 1)

        def reducer(self, _, word):
            for i in word:
                p = morph.parse(word)[0] 
                yield p                  

    if __name__ == '__main__':
        MRMorphWord.run()

Вот сообщение об ошибке:

parse
    word_lower = word.lower()
AttributeError: 'generator' object has no attribute 'lower'

Морфологический анализ слов с MRJob и Pymorphy2

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Морфологический анализ слов с MRJob и Pymorphy2

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы