Ошибка при переводе текста в Python с помощью googletrans - PullRequest
0 голосов
/ 05 ноября 2019

У меня есть многоязычный текст в файле .csv. Я пытался перевести текст с помощью следующего кода:

   from googletrans import Translator
   translator = Translator()
   infile=open('filename.csv','r',encoding='UTF-8')
   for txt in infile.readlines():
       print(translator.translate(txt).text) 

Часть файла .csv выглядит следующим образом:

Бернард Николь Родригес по-прежнему-nosotros nada de resorts en egipto, 98% mochileros yasalvo jajaja

я не знаю

Людовик Л.Г. Джули Сантони Пуэн-ле-Гар ... Vous Etes Pas Passés Loin ... еще раз, Bien Triste Tout CA ...

ужасно

хрип-де-до

привет, сью

люблю выпускные вечера .... пожалуйста, транслируйте по всему миру снова (вчера вечером)

рип Брэдли

† Рип Брэдли †

ты заставляешь меня плакать. Я люблю тебя, мальчик, хх

Рип хх

Влюбленное сердце ️ Инва

Рип Брэдли

Ума Сепси Яй Более глупые люди

К вашему сведению: я не козырный сторонник

ท รั้ ม ป์. ระวัง ซิ พ สมอ แม้ว. ไอ้ หมา กิน ความคุึ ด นะ.. มัน จะ ยุยง ให้ ซาว บ้าน เผา ประเทศ. นป์ รั้ ม ป์ ..

Рип Лоури

такой грустный Рип

Рип маленький человечек хх

Рип Брэдли

Рип Брэдли х

rip

Иоганнес, какое время быть живым

муравей фу u + 1f48a u + 1f48a u + 1f48a 10er

:): d;)- £ 25

Код дает следующие ошибки-

   JSONDecodeError                         Traceback (most recent call last)
   <ipython-input-3-17dd681d37d9> in <module>
       4 for txt in infile.readlines():
       5     txt = txt.rstrip("\n")
 ----> 6     print(translator.translate(txt).text)

   c:\python\python37\lib\site-packages\googletrans\client.py in 
   translate(self, text, dest, src)
    170 
    171         origin = text
--> 172         data = self._translate(text, dest, src)
    173 
    174         # this code will be updated when the format is changed.

    c:\python\python37\lib\site-packages\googletrans\client.py in 
    _translate(self, text, dest, src)
    79         r = self.session.get(url, params=params)
    80 
  ---> 81         data = utils.format_json(r.text)
    82         return data
    83 

    c:\python\python37\lib\site-packages\googletrans\utils.py in 
    format_json(original)
    60         converted = json.loads(original)
    61     except ValueError:
 ---> 62         converted = legacy_format_json(original)
    63 
    64     return converted

 c:\python\python37\lib\site-packages\googletrans\utils.py in 
 legacy_format_json(original)
    52             text = text[:p] + states[j][1] + text[nxt:]
    53 
---> 54     converted = json.loads(text)
    55     return converted
    56 

c:\python\python37\lib\json\__init__.py in loads(s, encoding, cls, 
object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, 
**kw)
    346             parse_int is None and parse_float is None and
    347             parse_constant is None and object_pairs_hook is None and 
          not kw):
--> 348         return _default_decoder.decode(s)
    349     if cls is None:
    350         cls = JSONDecoder

c:\python\python37\lib\json\decoder.py in decode(self, s, _w)
    335 
    336         """
--> 337         obj, end = self.raw_decode(s, idx=_w(s, 0).end())
    338         end = _w(s, end).end()
    339         if end != len(s):

c:\python\python37\lib\json\decoder.py in raw_decode(self, s, idx)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...