У меня есть многоязычный текст в файле .csv. Я пытался перевести текст с помощью следующего кода:
from googletrans import Translator
translator = Translator()
infile=open('filename.csv','r',encoding='UTF-8')
for txt in infile.readlines():
print(translator.translate(txt).text)
Часть файла .csv выглядит следующим образом:
Бернард Николь Родригес по-прежнему-nosotros nada de resorts en egipto, 98% mochileros yasalvo jajaja
я не знаю
Людовик Л.Г. Джули Сантони Пуэн-ле-Гар ... Vous Etes Pas Passés Loin ... еще раз, Bien Triste Tout CA ...
ужасно
хрип-де-до
привет, сью
люблю выпускные вечера .... пожалуйста, транслируйте по всему миру снова (вчера вечером)
рип Брэдли
† Рип Брэдли †
ты заставляешь меня плакать. Я люблю тебя, мальчик, хх
Рип хх
Влюбленное сердце ️ Инва
Рип Брэдли
Ума Сепси Яй Более глупые люди
К вашему сведению: я не козырный сторонник
ท รั้ ม ป์. ระวัง ซิ พ สมอ แม้ว. ไอ้ หมา กิน ความคุึ ด นะ.. มัน จะ ยุยง ให้ ซาว บ้าน เผา ประเทศ. นป์ รั้ ม ป์ ..
Рип Лоури
такой грустный Рип
Рип маленький человечек хх
Рип Брэдли
Рип Брэдли х
rip
Иоганнес, какое время быть живым
муравей фу u + 1f48a u + 1f48a u + 1f48a 10er
:): d;)- £ 25
Код дает следующие ошибки-
JSONDecodeError Traceback (most recent call last)
<ipython-input-3-17dd681d37d9> in <module>
4 for txt in infile.readlines():
5 txt = txt.rstrip("\n")
----> 6 print(translator.translate(txt).text)
c:\python\python37\lib\site-packages\googletrans\client.py in
translate(self, text, dest, src)
170
171 origin = text
--> 172 data = self._translate(text, dest, src)
173
174 # this code will be updated when the format is changed.
c:\python\python37\lib\site-packages\googletrans\client.py in
_translate(self, text, dest, src)
79 r = self.session.get(url, params=params)
80
---> 81 data = utils.format_json(r.text)
82 return data
83
c:\python\python37\lib\site-packages\googletrans\utils.py in
format_json(original)
60 converted = json.loads(original)
61 except ValueError:
---> 62 converted = legacy_format_json(original)
63
64 return converted
c:\python\python37\lib\site-packages\googletrans\utils.py in
legacy_format_json(original)
52 text = text[:p] + states[j][1] + text[nxt:]
53
---> 54 converted = json.loads(text)
55 return converted
56
c:\python\python37\lib\json\__init__.py in loads(s, encoding, cls,
object_hook, parse_float, parse_int, parse_constant, object_pairs_hook,
**kw)
346 parse_int is None and parse_float is None and
347 parse_constant is None and object_pairs_hook is None and
not kw):
--> 348 return _default_decoder.decode(s)
349 if cls is None:
350 cls = JSONDecoder
c:\python\python37\lib\json\decoder.py in decode(self, s, _w)
335
336 """
--> 337 obj, end = self.raw_decode(s, idx=_w(s, 0).end())
338 end = _w(s, end).end()
339 if end != len(s):
c:\python\python37\lib\json\decoder.py in raw_decode(self, s, idx)