Я подумываю о том, чтобы выполнить предварительный анализ текста для набора большого индивидуального файла .pst, содержащего> 4 года общения.
Изначально я хотел бы просто извлечь информацию заголовка для идентификации социальных сетей, нов конечном счете, хотел бы начать классифицировать электронные письма на основе ключевых слов или создать какой-либо структурированный вывод, который бы поддерживал некоторый дальнейший анализ.
У кого-нибудь есть предложения, с чего начать?