У меня есть датафрейм со столбцом, содержащим объекты списка. Я пытаюсь перевести эти списки на английский язык в новом столбце в том же кадре данных с помощью Google translate.
| Skills
__|________________________
0 | ['item1', 'item2', ...]
1 | ['item1', 'item2', ...]
2 | [...]
Столбец в указанном выше формате в кадре данных. Я могу перевести одну запись столбца за раз, но когда я пытаюсь преобразовать весь столбец в новый столбец, я получаю сообщения об ошибках.
Я использовал следующий код для перевода первой записи в столбце иработал нормально:
j = data['col].iloc[0].strip('[]').replace("'", '').split(',')
[translator.translate(i).text for i in j]
Я решил создать функцию для перевода всего столбца, но я получаю ошибки.
def trans(x):
j = [a for b in x.strip('[]').replace("'", '').split(',') for a in b]
s = [translator.translate(i).text for i in j]
return s
data['Skills_translated'] = data['Skills'].map(trans)
Пожалуйста, смотрите сообщение об ошибке ниже:
JSONDecodeError Traceback (most recent call last)
<ipython-input-39-a5eb1b31fe14> in <module>
3 s = [translator.translate(i).text for i in j]
4 return s
----> 5 data['Skills_translated'] = data['Skills'].map(trans)
6 data
~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\series.py in map(self, arg, na_action)
3380 """
3381 new_values = super(Series, self)._map_values(
-> 3382 arg, na_action=na_action)
3383 return self._constructor(new_values,
3384 index=self.index).__finalize__(self)
~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\base.py in _map_values(self, mapper, na_action)
1216
1217 # mapper is a function
-> 1218 new_values = map_f(values, mapper)
1219
1220 return new_values
pandas/_libs/lib.pyx in pandas._libs.lib.map_infer()
<ipython-input-39-a5eb1b31fe14> in trans(x)
1 def trans(x):
2 j = [a for b in x.strip('[]').replace("'", '').split(',') for a in b]
----> 3 s = [translator.translate(i).text for i in j]
4 return s
5 data['Skills_translated'] = data['Skills'].map(trans)
<ipython-input-39-a5eb1b31fe14> in <listcomp>(.0)
1 def trans(x):
2 j = [a for b in x.strip('[]').replace("'", '').split(',') for a in b]
----> 3 s = [translator.translate(i).text for i in j]
4 return s
5 data['Skills_translated'] = data['Skills'].map(trans)
~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\client.py in translate(self, text, dest, src)
170
171 origin = text
--> 172 data = self._translate(text, dest, src)
173
174 # this code will be updated when the format is changed.
~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\client.py in _translate(self, text, dest, src)
79 r = self.session.get(url, params=params)
80
---> 81 data = utils.format_json(r.text)
82 return data
83
~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\utils.py in format_json(original)
60 converted = json.loads(original)
61 except ValueError:
---> 62 converted = legacy_format_json(original)
63
64 return converted
~\AppData\Local\Continuum\anaconda3\lib\site-packages\googletrans\utils.py in legacy_format_json(original)
52 text = text[:p] + states[j][1] + text[nxt:]
53
---> 54 converted = json.loads(text)
55 return converted
56
~\AppData\Local\Continuum\anaconda3\lib\json\__init__.py in loads(s, encoding, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
346 parse_int is None and parse_float is None and
347 parse_constant is None and object_pairs_hook is None and not kw):
--> 348 return _default_decoder.decode(s)
349 if cls is None:
350 cls = JSONDecoder
~\AppData\Local\Continuum\anaconda3\lib\json\decoder.py in decode(self, s, _w)
335
336 """
--> 337 obj, end = self.raw_decode(s, idx=_w(s, 0).end())
338 end = _w(s, end).end()
339 if end != len(s):
~\AppData\Local\Continuum\anaconda3\lib\json\decoder.py in raw_decode(self, s, idx)
353 obj, end = self.scan_once(s, idx)
354 except StopIteration as err:
--> 355 raise JSONDecodeError("Expecting value", s, err.value) from None
356 return obj, end
JSONDecodeError: Expecting value: line 1 column 1 (char 0)