Я новичок в Alteryx и пытаюсь использовать его для анализа неструктурированных данных.У меня есть столбец описания в текстовом виде, и я собираюсь использовать инструмент кластеризации K-Means для моделирования тем.Чтобы K-средства работали с текстом, мне нужно будет преобразовать мой текст в матрицу терминов документа (DTM), чтобы они выглядели как непрерывные переменные для инструмента кластеризации.Однако я изо всех сил пытаюсь найти способ, которым я могу преобразовать свой текст в DTM.
Кто-нибудь знает способ сделать это?В настоящее время я смотрю на инструмент R, но не совсем уверен, с чего начать.Надеясь, что все вы, эксперты здесь, можете мне помочь!
Я просмотрел посты по анализу текста и понял, что большинство обратилось к макросу анализа текста Microsoft Azure ML.Тем не менее, я хотел бы избежать использования макроса (чтобы его не ограничивали ограниченные прогоны каждый месяц для масштабируемости) и вместо этого использовать инструменты, доступные в Alteryx.
Заранее всем спасибо!