Как я могу перевести список строк в кадре данных с других языков на английский в Python? - PullRequest
0 голосов
/ 11 октября 2019

У меня есть датафрейм со столбцом, содержащим объекты списка. Я пытаюсь перевести эти списки на английский язык в новом столбце в том же кадре данных с помощью Google translate.

  | Skills
__|________________________
0 | ['item1', 'item2', ...]
1 | ['item1', 'item2', ...]
2 | [...]

Столбец в указанном выше формате в кадре данных. Я могу перевести одну запись столбца за раз, но когда я пытаюсь преобразовать весь столбец в новый столбец, я получаю сообщения об ошибках.

Я использовал следующий код для перевода первой записи в столбце иработал нормально:

j = data['col].iloc[0].strip('[]').replace("'", '').split(',')
[translator.translate(i).text for i in j]

Я решил создать функцию для перевода всего столбца, но я получаю ошибки.

def trans(x):
    j = [a for b in x.strip('[]').replace("'", '').split(',') for a in b]
    s = [translator.translate(i).text for i in j]
    return s
data['Skills_translated'] = data['Skills'].map(trans)

Пожалуйста, смотрите сообщение об ошибке ниже:

JSONDecodeError                           Traceback (most recent call last)
<ipython-input-39-a5eb1b31fe14> in <module>
      3     s = [translator.translate(i).text for i in j]
      4     return s
----> 5 data['Skills_translated'] = data['Skills'].map(trans)
      6 data

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\series.py in map(self, arg, na_action)
   3380         """
   3381         new_values = super(Series, self)._map_values(
-> 3382             arg, na_action=na_action)
   3383         return self._constructor(new_values,
   3384                                  index=self.index).__finalize__(self)

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\base.py in _map_values(self, mapper, na_action)
   1216 
   1217         # mapper is a function
-> 1218         new_values = map_f(values, mapper)
   1219 
   1220         return new_values

pandas/_libs/lib.pyx in pandas._libs.lib.map_infer()

<ipython-input-39-a5eb1b31fe14> in trans(x)
      1 def trans(x):
      2     j = [a for b in x.strip('[]').replace("'", '').split(',') for a in b]
----> 3     s = [translator.translate(i).text for i in j]
      4     return s
      5 data['Skills_translated'] = data['Skills'].map(trans)

<ipython-input-39-a5eb1b31fe14> in <listcomp>(.0)
      1 def trans(x):
      2     j = [a for b in x.strip('[]').replace("'", '').split(',') for a in b]
----> 3     s = [translator.translate(i).text for i in j]
      4     return s
      5 data['Skills_translated'] = data['Skills'].map(trans)

~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\client.py in translate(self, text, dest, src)
    170 
    171         origin = text
--> 172         data = self._translate(text, dest, src)
    173 
    174         # this code will be updated when the format is changed.

~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\client.py in _translate(self, text, dest, src)
     79         r = self.session.get(url, params=params)
     80 
---> 81         data = utils.format_json(r.text)
     82         return data
     83 

~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\utils.py in format_json(original)
     60         converted = json.loads(original)
     61     except ValueError:
---> 62         converted = legacy_format_json(original)
     63 
     64     return converted

~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\utils.py in legacy_format_json(original)
     52             text = text[:p] + states[j][1] + text[nxt:]
     53 
---> 54     converted = json.loads(text)
     55     return converted
     56 

~\AppData\Local\Continuum\anaconda3\lib\json\__init__.py in loads(s, encoding, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
    346             parse_int is None and parse_float is None and
    347             parse_constant is None and object_pairs_hook is None and not kw):
--> 348         return _default_decoder.decode(s)
    349     if cls is None:
    350         cls = JSONDecoder

~\AppData\Local\Continuum\anaconda3\lib\json\decoder.py in decode(self, s, _w)
    335 
    336         """
--> 337         obj, end = self.raw_decode(s, idx=_w(s, 0).end())
    338         end = _w(s, end).end()
    339         if end != len(s):

~\AppData\Local\Continuum\anaconda3\lib\json\decoder.py in raw_decode(self, s, idx)
    353             obj, end = self.scan_once(s, idx)
    354         except StopIteration as err:
--> 355             raise JSONDecodeError("Expecting value", s, err.value) from None
    356         return obj, end

JSONDecodeError: Expecting value: line 1 column 1 (char 0)
...