Перевод текста с помощью панд - PullRequest
0 голосов
/ 13 декабря 2018

Я пытаюсь перевести текстовый столбец, используя python, который содержит разный текст на разных языках.пока что ничего сложного с моим кодомNoneType 'object не имеет атрибута' group '

Я ищу другой код и нашел:

from textblob import TextBlob
df['Text to English'] = df['Text'].str.encode('ascii', 'ignore').apply(lambda x: TextBlob(x.strip()).translate(to='en'))

, но он выдал ошибку: TypeError: cannot use a string pattern on a bytes-like object

есть ли решение для этого ??и заранее спасибо

1 Ответ

0 голосов
/ 13 декабря 2018

Я думаю, что есть значения None или NaN s, поэтому можно отфильтровать их по notna:

mask = df['Text'].notna()
df.loc[mask,'Text to English'] = df.loc[mask, 'Text'].apply(translator.translate, 
                                                            src='id', dest='en')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...