Это не вопрос кода, а понятия. Я хочу знать, кто является основным автором / исследователями в области извлечения информации, обработки естественного языка и добычи текста, чтобы читать его статьи / книги / работы.
Хотя это не полный список, Антологическая сеть ACL имеет список рейтингов, которые дают вам представление о том, какие статьи часто цитируются в области компьютерной лингвистики.
Вы найдете очень хорошие ссылки на Quora в:
Какие наиболее важные исследовательские работы должны обязательно прочитать все студенты НЛП?
Взгляните на «Справочник по интеллектуальному анализу данных - Нонг Йе», где вы найдете множество статей.Это также должно указать вам на ключевых исследователей в области интеллектуального анализа текста / данных.
http://www.amazon.com/Handbook-Mining-Human-Factors-Ergonomics/dp/0805855637/ref=sr_1_1?s=books&ie=UTF8&qid=1328297313&sr=1-1
Для записи я владею этой книгой.
Стэнфорд предлагает онлайн-класс по обработке естественного языка. Посетите http://www.nlp -class.org /
Для меня Даниэль Джурафски , Кристофер Мэннинг и Том Митчелл .