Как развернуть или разрезать и нарезать кубиками слово облако - PullRequest
0 голосов
/ 20 сентября 2019

Скажем, у меня есть два столбца в моем наборе данных, Состояние и Комментарии .Это в основном комментарии людей из разных штатов.Я хочу проанализировать колонку комментариев, скажем, я хочу увидеть наиболее часто используемое слово в определенном состоянии.Например, комментарии людей, принадлежащих к Техасу.Я хочу создать гистограмму или облако слов для этих данных, и я хочу, чтобы они менялись соответственно, когда я нажимаю или выбираю определенное состояние.Например,Скажем, есть облако слов, показывающее ответы всего набора данных.Теперь, если я нажму на Техас, мое слово «облако» должно измениться, соответственно, показывая ответы только от Техаса

Так что же лучше сделать?это можно сделать в Power Bi или Python?Если это так, пожалуйста, скажите мне, как это сделать.

1 Ответ

0 голосов
/ 21 сентября 2019

Для этого можно использовать Облако слов .Вам нужно сначала установить его, прежде чем использовать в своем отчете.Просто нажмите кнопку GET IT NOW и следуйте инструкциям.

Следуя вашему вопросу, предположим, что у вас есть такая таблица:

enter image description here

Затем поместите визуальный слайсер и добавьте к нему поле State.Он должен выглядеть следующим образом:

enter image description here

Затем поместите визуальный объект Word Cloud в свой отчет и добавьте поле Comment в качестве категории Word Cloud, например:

enter image description here

Теперь, когда в слайсере ничего не выбрано, вы увидите данные из всех состояний.Если вы хотите просмотреть данные для определенного состояния, выберите их в слайсере.Чтобы увидеть данные из более чем одного состояния, удерживайте клавишу Ctrl, чтобы выбрать более одного элемента в слайсере.

ОБНОВЛЕНИЕ: Если вам нужно просто посчитать вхождения слов, то вы можете разделить комментарии по пробелам (используйте Split column -> By delimeter команда с ленты например).Если вы разделите столбец Comment на пробелы, открутите все результирующие столбцы Comment.x, чтобы получить таблицу со столбцами для состояния и слова, для простоты добавьте пользовательский столбец int Word count с постоянным значением 1, вы можете анализировать количество слов втаблицы и диаграммы (и добавьте срез для состояния для фильтрации данных):

enter image description here

Но будет много «шумовых слов», которые вызахочется позаботиться о.Возможно, вы также захотите взглянуть на Azure Cognitive Services Text Analytics .

...