Произведите грамматический анализ нескольких сотен абзацев - PullRequest
2 голосов
/ 15 февраля 2012

У меня есть 1000 (например) записей записей о поддержке клиентов, которые зарегистрированы.

Каждая из этих заметок (длиной от 25 до 500 символов) была введена пользователем в систему (пользователи)будет создано несколько заметок), я хотел бы иметь возможность генерировать эквивалент «грамматического KPI», анализируя текст.

Я хочу воздержаться от проверки орфографии против них,но лучше посмотрите на последовательность базовой грамматики, такой как заглавные буквы и знаки препинания (если возможно, исправьте знаки препинания).Включение многословия каждой ноты для учета в выводе указанного «KPI» также было бы интересным поворотом.

Без погружения в языки программирования, какой самый эффективный способ / метод создания не на 100%точное представление, но достаточно, чтобы увидеть выбросы грамматики в примечаниях, представленных этими пользователями?

У меня нет опыта работы с чем-либо подобным.

Спасибо

1 Ответ

1 голос
/ 10 декабря 2012

Эта презентация директора Python Software Foundation фактически посвящена извлечению семантики из официальных документов (патентных лицензий):

http://vimeo.com/53058803

В этой статье описываются методы извлечения настроения из письменного текста:

http://goo.gl/wY9sW

...