Предпочтительные форматы визуализации облака тегов - PullRequest
8 голосов
/ 06 августа 2009

Из любопытства хотелось бы узнать, какие форматы облаков тегов лучше всего подходят для обнаружения все большего и большего (соответствующего) контента?

Мне известны 3 формата, но я не знаю, какой из них лучший.

1) вкусный - цветовая заливка

2) стандартный с изменениями размера шрифта -

3) На этом сайте - цифры, показывающие важность / использование.

Так какие из них вы предпочитаете? а почему?

Edit: Благодаря приведенным ниже ответам, я теперь гораздо лучше понимаю методы визуализации облака тегов.

4) Parallel Tag Clouds - простое использование техники параллельных координат. Я нахожу это более организованным и читабельным.

5) диаграмма Ворони - более полезна для выявления связей тегов и принятия решений на их основе. Не служит нашей цели обнаружения соответствующего контента.

6) Карты разума. Они хороши и их можно использовать для пошаговой фильтрации содержимого.

Я нашел здесь несколько более интересных техник - http://www.cs.toronto.edu/~ccollins/research/index.html

Ответы [ 4 ]

3 голосов
/ 21 августа 2009

Я действительно думаю, что это зависит от содержания информации и аудитории.То, что относится к одному, не относится к другому.Если аудитория более специализирована, то она с большей вероятностью будет думать в том же духе, но поставщик контента все равно будет анализировать ее и обслуживать.

Есть также несколько путей, по которым человекможно взять, чтобы «узнать больше».Возьмите тег «DNS», например.Вы можете перейти к более конкретным деталям, таким как «UDP-порт 53» и «MX-запись», или вы можете использовать такие термины, как «IP-адрес», «Имя хоста» и «URL».Диаграмма Вороной показывает кластеры, но не справляется со случаем, когда общие термины могут быть связаны со многими понятиями.Отображение имени хоста на «DNS», «HTTP», «SSH» и т. Д.

Я заметил, что в некоторых облаках тегов обычно есть один или два элемента, которые значительно больше других.Подобные вещи могут обслуживаться картой разума, где из одной центральной концепции исходят другие.

Для случаев с множеством «основных тем», где карта разума неуместна, есть параллельные координаты но это было бы непонятно для многих пользователей сети.

Я думаю, что если бы мы нашли чрезвычайно хорошо организованный способ сортировки кластеров тегов при сохранении связей между общностями и особенностями, это было бы несколькополезно для исследования ИИ.

С точки зрения того, что я лично предпочитаю, я думаю, что числовой подход хорош, потому что нечасто упоминаемые теги все еще представлены с читаемым размером шрифта.Я также думаю, что SO делает это таким образом, потому что у них гораздо больше тегов для покрытия, чем у облака среднего размера по стандарту.

1 голос
/ 22 августа 2009

Я бы пошел с # 2 из вариантов, которые вы перечислили выше.

  • 1 - человеческий глаз распознает и понимает различия в размерах гораздо эффективнее, чем цвет, когда цветовая гамма находится в одном и том же спектре (т. Е. Различные оттенки синего в отличие от отдельных отдельных цветов).

  • 3 - Требуется, чтобы пользователь сканировал полный список и математически сравнивал каждое отдельное число во время сканирования. Нет реальных значимых отношений между тегами без большой работы со стороны пользователей.

Итак, переходя к # 2, необходимо принять во внимание несколько соображений:

  • Держите теги в алфавитном порядке. Это предоставляет пользователю другой метод поиска и устанавливает известные отношения между ними (при условии, что они знают алфавит!). Если они неупорядочены, это просто дерьмо, чтобы найти один.
  • Если сравнение размеров абсолютно необходимо (обычно это не так, поскольку вы можете увеличить каждый уровень на определенный процент или количество пикселей), используйте моноширинный шрифт. В противном случае некоторые буквенные комбинации могут в конечном итоге выглядеть на больше, чем они есть на самом деле.
  • Не включайте запятые, трубы и другие разделители. У вас уже будет много данных в небольшой области - нет необходимости загромождать их мусором. Разумеется, расставьте метки с достаточным количеством отступов. Просто не удваивайте количество визуальных элементов, добавляя не только данные.
  • Установите минимальный / максимальный размер шрифта и масштаб между ними. Существуют ситуации, когда один тег может быть настолько популярным, что визуально он может показаться экспоненциально большим, чем другие. Кроме того, вы не хотите, чтобы тег заканчивал рендеринг с 1px! Установите мин / макс и при необходимости отрегулируйте.
0 голосов
/ 23 августа 2009

Мой любимый формат облаков тегов - Wordle . Выглядит отлично, а также отлично справляется с размещением большого количества тегов в небольшом пространстве.

0 голосов
/ 21 августа 2009

размер отрегулирован ворони диаграммы - показывает, какие теги взаимосвязаны

...