Я работаю над googletrans, беря таблицу из PDF-файла на арабском языке c. Затем я хочу перевести на английский sh. Код для получения таблицы:
x=read_pdf("arabic.pdf", output_format = "xml", sheet_name='Dataset1')
x
Это дает следующую таблицу:
اسمي سلطانمرحباً\rمن اين انت؟انا من ولاية كارولينا الشمال\r1234عندي 47 قطط\rاسمي Jeremy في الانجليزيةهل انت شباك؟\rJeremy is جرمي in Arabic Unnamed: 1
0 مرحباً اسمي سلطان
1 انا من ولاية كارولينا الشمال من اين انت؟
2 1234 عندي 47 قطط
3 هل انت شباك؟ اسمي Jeremy في الانجليزية
4 Jeremy is جرمي in Arabic NaN
5 NaN NaN
6 اسمي سلطانمرحباً\rمن اين انت؟انا من ولاية كارو... NaN
7 مرحباً اسمي سلطان
8 انا من ولاية كارولينا الشمال من اين انت؟
9 1234 عندي 47 قطط
10 هل انت شباك؟ اسمي Jeremy في الانجليزية
11 Jeremy is جرمي in Arabic NaN
Теперь я пытаюсь перевести его. Я пытаюсь:
from googletrans import Translator
trans = Translator()
t = trans.translate(x , dest='en')
print(f'Source: {t.src}')
print(f'Destination: {t.dest}')
print(f'{t.origin} -> {t.text}')
print()
Я получаю следующую ошибку:
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-84-b62499236482> in <module>
2
3 trans = Translator()
----> 4 t = trans.translate(x , dest='en')
5 print(f'Source: {t.src}')
6 print(f'Destination: {t.dest}')
~\Anaconda3\lib\site-packages\googletrans\client.py in translate(self, text, dest, src)
170
171 origin = text
--> 172 data = self._translate(text, dest, src)
173
174 # this code will be updated when the format is changed.
~\Anaconda3\lib\site-packages\googletrans\client.py in _translate(self, text, dest, src)
73 text = text.decode('utf-8')
74
---> 75 token = self.token_acquirer.do(text)
76 params = utils.build_params(query=text, src=src, dest=dest,
77 token=token)
~\Anaconda3\lib\site-packages\googletrans\gtoken.py in do(self, text)
199 def do(self, text):
200 self._update()
--> 201 tk = self.acquire(text)
202 return tk
~\Anaconda3\lib\site-packages\googletrans\gtoken.py in acquire(self, text)
145 # Convert text to ints
146 for i in text:
--> 147 val = ord(i)
148 if val < 0x10000:
149 a += [val]
TypeError: ord() expected a character, but string of length 135 found
Кто-нибудь может мне помочь, как я могу ее решить? Спасибо!