用Python读取阿拉伯语语料库
我想用Python读取阿拉伯语字典Bw,然后提取一些词汇项目,比如"N"和"V"。另外,我还有阿拉伯语的Pen树库,我想从中提取三元组(trigram)。我对使用Python还很陌生,不知道该从哪里开始。
1 个回答
0
一切都从这里开始。
Python是处理自然语言最常用的工具,使用NLTK的学术界人士已经开发了许多工具,可以满足你大部分的需求。
最好从这样的教程开始学习,http://www.desilinguist.org/pdf/crossroads.pdf,先用一种简单的欧洲语言进行练习。等你对这些工具更熟悉后,再开始处理阿拉伯语的文本。