Я пытаюсь использовать код лемматизатора Farasa в своем коде для лемматизации текстовых файлов или файлов csv, содержащих арабский c язык. вот ссылка на код http://alt.qcri.org/farasa/
Я попытался просто передать текст для переменной payload , и она работает. На мой вопрос я могу передать файл в код на сайте farasa, чтобы начать процесс лемматизации. Я пытаюсь понять, что такое (полезная нагрузка), но я не могу
Вот что я пытался
import http.client
from IPython.core import payload
conn = http.client.HTTPSConnection("farasa-api.qcri.org")
payload = "{\"text\": \"يجب أن يرحلوا و يعودوا إلى الوطن هذا مثال بسيط\"}".encode("utf-8")
#the below line is not working
#payload = "{\"file\":\"F:/AIenv/textAnalysis/testin2.txt\"}".encode("utf-8")
headers = { "content-type": "application/json", "cache-control": "no-cache", }
conn.request("POST", "/msa/webapi/lemma", payload, headers)
# conn.request("POST", "/msa/webapi/lemma", files = files, headers=headers)
res = conn.getresponse()
data = res.read()
print(data.decode("utf-8"))
Кто-нибудь имеет представление об этой проблеме и как ее можно исправить?