Python Arabic NLP - PullRequest
       10

Python Arabic NLP

18 голосов
/ 12 сентября 2011

Я нахожусь в процессе оценки возможностей НЛТК в обработке текста на арабском языке в исследовании для анализа и извлечения настроений.

Вопрос в следующем:

  1. Способен ли NTLK обрабатывать и позволяет анализировать текст на арабском языке?
  2. Может ли python манипулировать \ маркировать арабский текст?
  3. Смогу ли я анализировать и хранить арабский текст, используя Python?

Если python и NTLK не являются инструментами для этой работы, какие инструменты вы бы порекомендовали (если они существуют)?

Спасибо.


EDIT

На основании исследования:

  1. NTLK поддерживает только арабский текст: Ссылка
  2. Python способен обрабатывать арабский текст, поскольку он поддерживает Unicode UTF-8: Ссылка
  3. Разбор и лемматизация арабского текста может быть выполнена с помощью: Статистический анализатор SNLPG (Stanford Natural Language Processing Group): Ссылка

1 Ответ

5 голосов
/ 12 сентября 2011

Простой поиск в Google ведет по этим ссылкам:

Обработка арабского естественного языка

Использование Python с Корпусом арабского корана

HOWTO: Работа с Python, Unicode и арабским

Является ли что-нибудь из этого полезным?

...