使用http.client登录在线Farasa lemmatizer并对阿拉伯语文本文件内容进行lemmatize

2024-05-29 05:29:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用Farasa lemmatizer的代码对包含阿拉伯语的文本文件或csv文件进行lemmatize。这是代码http://alt.qcri.org/farasa/的链接

我试图为有效负载变量传递一个文本,结果成功了。 我的问题是,我是否可以将文件传递给farasa网站上的代码,以开始柠檬化过程。我试图理解什么是(有效载荷),但我无法理解

以下是我的尝试

import http.client
from IPython.core import payload

conn = http.client.HTTPSConnection("farasa-api.qcri.org") 
payload = "{\"text\": \"يجب أن يرحلوا و يعودوا إلى الوطن هذا مثال بسيط\"}".encode("utf-8")

#the below line is not working 
#payload = "{\"file\":\"F:/AIenv/textAnalysis/testin2.txt\"}".encode("utf-8")

headers = { "content-type": "application/json", "cache-control": "no-cache", }

conn.request("POST", "/msa/webapi/lemma", payload, headers)

# conn.request("POST", "/msa/webapi/lemma", files = files, headers=headers)
res = conn.getresponse()

data = res.read()

print(data.decode("utf-8"))

有人知道这个问题吗?如何解决


Tags: 文件代码orgimportclienthttpcacherequest

热门问题