Question

Я недавно выучил Mapreduce , код, который я скопировал:

import os
import re
from mrjob.job import MRJob
from mrjob.step import MRStep

word_search_re = re.compile(r"[\w']+")

class ExtractPosts(MRJob):
    post_start = False
    post = []
    def mapper(self, key, line):
        filename = os.environ["map_input_file"]
        gender = filename.split(".")[1]
        try:
            docnum = int(filename[0])
        except:
            docnum = 8
        if filename.startswith("51"):
            # remove leading and trailing whitespace
            line = line.strip()
            if line == "<post>":
                self.post_start = True
            elif line == "</post>":
                self.post_start = False
                yield gender, repr("\n".join(self.post))
                self.post = []
            elif self.post_start:
                self.post.append(line)

Затем в командной строке от имени администратора выполните:

python extract_posts.py f:/blogs/51* --output-dir=f:/blogposts

Проблема пришлаout:

Я искал в Интернете, ответы выглядят не подходящими для моей проблемы.Я понятия не имею, что делать.У меня есть некоторые файлы, такие как part-00000 в выходном каталоге.

Как устранить ошибку WindowsError: [Ошибка 5] при использовании MapReduce:

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как устранить ошибку WindowsError: [Ошибка 5] при использовании MapReduce:

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы