Текстовое копирование почтового архива Outlook - PullRequest
1 голос
/ 31 января 2011

Я подумываю о том, чтобы выполнить предварительный анализ текста для набора большого индивидуального файла .pst, содержащего> 4 года общения.

Изначально я хотел бы просто извлечь информацию заголовка для идентификации социальных сетей, нов конечном счете, хотел бы начать классифицировать электронные письма на основе ключевых слов или создать какой-либо структурированный вывод, который бы поддерживал некоторый дальнейший анализ.

У кого-нибудь есть предложения, с чего начать?

1 Ответ

2 голосов
/ 09 марта 2011

Вам следует проверить результаты исследования общедоступных данных Enron Email Dataset -> На странице есть ссылки на некоторые интересные статьи

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...