ord () ожидал символ, но для googletrans найдена строка длиной 135 - PullRequest
0 голосов
/ 16 июня 2020

Я работаю над googletrans, беря таблицу из PDF-файла на арабском языке c. Затем я хочу перевести на английский sh. Код для получения таблицы:

x=read_pdf("arabic.pdf", output_format = "xml", sheet_name='Dataset1')
x

Это дает следующую таблицу:


اسمي سلطانمرحباً\rمن اين انت؟انا من ولاية كارولينا الشمال\r1234عندي 47 قطط\rاسمي Jeremy في الانجليزيةهل انت شباك؟\rJeremy is جرمي in Arabic Unnamed: 1
0   مرحباً  اسمي سلطان
1   انا من ولاية كارولينا الشمال    من اين انت؟
2   1234    عندي 47 قطط
3   هل انت شباك؟    اسمي Jeremy في الانجليزية
4   Jeremy is جرمي in Arabic    NaN
5   NaN NaN
6   اسمي سلطانمرحباً\rمن اين انت؟انا من ولاية كارو...   NaN
7   مرحباً  اسمي سلطان
8   انا من ولاية كارولينا الشمال    من اين انت؟
9   1234    عندي 47 قطط
10  هل انت شباك؟    اسمي Jeremy في الانجليزية
11  Jeremy is جرمي in Arabic    NaN

Теперь я пытаюсь перевести его. Я пытаюсь:

from googletrans import Translator

trans = Translator()
t = trans.translate(x , dest='en')
print(f'Source: {t.src}')
print(f'Destination: {t.dest}')
print(f'{t.origin} -> {t.text}')
print()

Я получаю следующую ошибку:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-84-b62499236482> in <module>
      2 
      3 trans = Translator()
----> 4 t = trans.translate(x , dest='en')
      5 print(f'Source: {t.src}')
      6 print(f'Destination: {t.dest}')

~\Anaconda3\lib\site-packages\googletrans\client.py in translate(self, text, dest, src)
    170 
    171         origin = text
--> 172         data = self._translate(text, dest, src)
    173 
    174         # this code will be updated when the format is changed.

~\Anaconda3\lib\site-packages\googletrans\client.py in _translate(self, text, dest, src)
     73             text = text.decode('utf-8')
     74 
---> 75         token = self.token_acquirer.do(text)
     76         params = utils.build_params(query=text, src=src, dest=dest,
     77                                     token=token)

~\Anaconda3\lib\site-packages\googletrans\gtoken.py in do(self, text)
    199     def do(self, text):
    200         self._update()
--> 201         tk = self.acquire(text)
    202         return tk

~\Anaconda3\lib\site-packages\googletrans\gtoken.py in acquire(self, text)
    145         # Convert text to ints
    146         for i in text:
--> 147             val = ord(i)
    148             if val < 0x10000:
    149                 a += [val]

TypeError: ord() expected a character, but string of length 135 found

Кто-нибудь может мне помочь, как я могу ее решить? Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...