Я нахожусь в процессе оценки возможностей НЛТК в обработке текста на арабском языке в исследовании для анализа и извлечения настроений.
Вопрос в следующем:
- Способен ли NTLK обрабатывать и позволяет анализировать текст на арабском языке?
- Может ли python манипулировать \ маркировать арабский текст?
- Смогу ли я анализировать и хранить арабский текст, используя Python?
Если python и NTLK не являются инструментами для этой работы, какие инструменты вы бы порекомендовали (если они существуют)?
Спасибо.
EDIT
На основании исследования:
- NTLK поддерживает только арабский текст: Ссылка
- Python способен обрабатывать арабский текст, поскольку он поддерживает Unicode UTF-8: Ссылка
- Разбор и лемматизация арабского текста может быть выполнена с помощью:
Статистический анализатор SNLPG (Stanford Natural Language Processing Group): Ссылка