Используйте http.client для входа в онлайн-лемматизатор Farasa и лемматизации содержимого текстового файла arabi c. - PullRequest
0 голосов
/ 14 апреля 2020

Я пытаюсь использовать код лемматизатора Farasa в своем коде для лемматизации текстовых файлов или файлов csv, содержащих арабский c язык. вот ссылка на код http://alt.qcri.org/farasa/

Я попытался просто передать текст для переменной payload , и она работает. На мой вопрос я могу передать файл в код на сайте farasa, чтобы начать процесс лемматизации. Я пытаюсь понять, что такое (полезная нагрузка), но я не могу

Вот что я пытался

import http.client
from IPython.core import payload

conn = http.client.HTTPSConnection("farasa-api.qcri.org") 
payload = "{\"text\": \"يجب أن يرحلوا و يعودوا إلى الوطن هذا مثال بسيط\"}".encode("utf-8")

#the below line is not working 
#payload = "{\"file\":\"F:/AIenv/textAnalysis/testin2.txt\"}".encode("utf-8")

headers = { "content-type": "application/json", "cache-control": "no-cache", }

conn.request("POST", "/msa/webapi/lemma", payload, headers)

# conn.request("POST", "/msa/webapi/lemma", files = files, headers=headers)
res = conn.getresponse()

data = res.read()

print(data.decode("utf-8"))

Кто-нибудь имеет представление об этой проблеме и как ее можно исправить?

...