В настоящее время я работаю в качестве эксперта по данным в большой компании, что означает, что у нас ежедневно приходит много писем, и мы хотели бы иметь возможность классифицировать их как можно точнее.
Количество данные не проблема вообще там. Я могу извлекать столько входящих писем, сколько захочу.
Я просто не знаю, с чего начать, и никогда не работал над проблематикой nlp, поэтому мне было интересно, какие идеи или техники вы придумали бы, ребята.
Меня интересуют как идеи для анализа имеющихся у меня данных, так и модели, которые я мог бы придумать. Я не хочу go слишком подробно описывать, где я работаю для некоторой конфиденциальности причина, но я мог бы ответить на некоторые ваши вопросы!
Мой главный вопрос - что делать со всеми этими неклассифицированными данными. Эти письма не помечены, так как я могу создать модель nlp и оценивать его выступления, не имея возможности рассчитать отзыв, точность ...
Не могли бы вы также порекомендовать, какие модели следует изучить для анализа входящих сообщений. Я хотел бы отметить их, например, биллинг, ошибка, вопрос и т. д. c ...
Большое спасибо