чтение корпуса Python-треска для арабского языка - PullRequest
3 голосов
/ 02 июня 2011

Я хочу прочитать арабский словарь Bw, а затем извлечь некоторые лексические элементы, такие как «N», «V» с помощью Python.Кроме того, у меня есть банк арабских перьев, и я хочу извлечь из него триграмму.Я так новичок в использовании Python, с чего мне начать?

1 Ответ

0 голосов
/ 04 августа 2011

Начать можно только с одного места.

http://www.nltk.org/

Python - наиболее часто используемый инструмент для обработки естественного языка, и сообщество ученых, которые создали и используют NLTK, возможно, ужесделал инструмент, который будет делать большую часть того, что вам нужно.

Лучше всего начать с учебника, подобного этому, http://www.desilinguist.org/pdf/crossroads.pdf и работать с простым европейским языком.Затем, когда вы познакомитесь с инструментами, начните работать с арабскими текстами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...