Создание DTM в Alteryx Designer - PullRequest
       14

Создание DTM в Alteryx Designer

0 голосов
/ 01 октября 2018

Я новичок в Alteryx и пытаюсь использовать его для анализа неструктурированных данных.У меня есть столбец описания в текстовом виде, и я собираюсь использовать инструмент кластеризации K-Means для моделирования тем.Чтобы K-средства работали с текстом, мне нужно будет преобразовать мой текст в матрицу терминов документа (DTM), чтобы они выглядели как непрерывные переменные для инструмента кластеризации.Однако я изо всех сил пытаюсь найти способ, которым я могу преобразовать свой текст в DTM.

Кто-нибудь знает способ сделать это?В настоящее время я смотрю на инструмент R, но не совсем уверен, с чего начать.Надеясь, что все вы, эксперты здесь, можете мне помочь!

Я просмотрел посты по анализу текста и понял, что большинство обратилось к макросу анализа текста Microsoft Azure ML.Тем не менее, я хотел бы избежать использования макроса (чтобы его не ограничивали ограниченные прогоны каждый месяц для масштабируемости) и вместо этого использовать инструменты, доступные в Alteryx.

Заранее всем спасибо!

1 Ответ

0 голосов
/ 01 октября 2018

, поскольку Alteryx представляет собой более простой рабочий процесс перетаскивания, объяснять здесь нетривиально, однако я создал следующий рабочий процесс и включил сам фактический рабочий процесс в форум Alteryx здесь .В рабочем процессе используются частоты терминов из речей Инаугурации, но они должны применяться к любой коллекции документов.Он просто разбивает слова на основе различных нечисловых символов и делает резюме.Вот как выглядит рабочий процесс:

enter image description here

...