Вы неправильно используете функцию перевода Python.
Поскольку я не уверен, используете ли вы python 2.7 или python 3, я предлагаю альтернативный подход.
Функция перевода немного изменяется в Python 3.
Следующий код будет работать независимо от версии Python.
def lower_clean_str(x):
punc='!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
lowercased_str = x.lower()
for ch in punc:
lowercased_str = lowercased_str.replace(ch, '')
return lowercased_str
l=sc.parallelize(["How are you","Hello\ then% you","I think he's fine+ COMING"])
one_RDD = l.map(lower_clean_str)
one_RDD.collect()
Выход:
[«Как дела?», «Привет!