лучший инструмент / язык программирования для визуализации данных - PullRequest
7 голосов
/ 15 июня 2011

До сих пор я в основном использовал excel для отображения любых данных, которые я получаю из MySQL, используя PHP, (иногда с JS-библиотекой, такой как HighCharts, для отображения данных). На самом деле это не вариант, когда мне нужны более сложные диаграммы / визуализации или если есть много записей (Excel получает slooooow), поэтому я ищу альтернативы. Однако вариантов так много! Я загружал и пробовал такие вещи, как R и Processing, несколько раз, но я не уверен, что это правильный инструмент для «простого» составления графика моих данных.

Так что ... мне любопытно высказать мнение о том, как лучше идти. Выучить Python? Действительно погрузиться в Java / обработка? какие-нибудь другие варианты? (или придерживайтесь PHP, и у вас есть действительно гибкая графическая библиотека?))

Ответы [ 7 ]

4 голосов
/ 15 июня 2011

Я думаю, что Python отлично подходит для быстрой и насыщенной обработки данных.

2 голосов
/ 26 января 2019

Я настоятельно рекомендую использовать Vega-Lite & Vega для визуализации данных с любого языка, который вы выберете.Vega-Lite и Vega разработаны на основе идей грамматики графики, которая вдохновила популярную библиотеку ggplot2 от R.Основная идея заключается в том, что визуализация данных должна быть построена в соответствии с декларативным описанием того, как свойства данных соответствуют эстетике dataviz.Однако Vega-Lite и Vega сделали еще один шаг вперед, предоставив грамматику взаимодействия , которая позволяет создавать интерактивные визуализации данных и сложные представления обозревателя.Более того, это повышает ставку на декларативный характер GG в том смысле, что спецификации Vega-Lite и Vega описываются как чистые данные (JSON).Таким образом, любой язык, который может разумно ориентироваться на JSON, может ориентироваться на Vega-Lite и Vega.

Vega-Lite - это более или менее высокотехнологичный инструмент для анализа данных, ориентированный на высокие рычаги и автоматизацию, основанный на очень спартанских спецификациях.Он компилируется в Vega, который является несколько более низким уровнем и более мощной, но менее автоматизированной версией Vega-Lite.Обычно начиная с Vega-Lite и переходя на Vega только при необходимости, достаточно.

Для получения дополнительной информации о Vega & Vega-Lite см .: https://vega.github.io.

В заключение, я 'Второе мнение Микеры и Равиндера Рама о том, что Clojure является отличным языком для науки о данных и постоянно совершенствуется благодаря новым библиотекам машинного обучения (например, MXNet только недавно получил поддержку Clojure ).Также теперь есть поддержка большинства современных научных приложений для ноутбуков (Jupyter, Nextjournal, Gorilla REPL), если это ваша вещь.

Если вы хотите использовать Vega-Lite или Vega из Clojure или ClojureScript, выВозможно, вы захотите проверить небольшую, но гибкую библиотеку-оболочку, которую я написал под названием Oz:

https://github.com/metasoarous/oz

Если вы заинтересованы в использовании Vega-Lite или Vega из других языков, есть многовыбрать из-за того, как просто обернуть (например, Python, R, React).

2 голосов
/ 08 марта 2012

Лично я считаю, что Incanter - отличный набор инструментов, который я могу от всей души порекомендовать (я использую его для визуализации в своих собственных проектах).

Это библиотека статистических вычислений и визуализации для Clojure, которая, в свою очередь, представляет собой очень мощный, гибкий и динамический язык, особенно подходящий для интерактивных экспериментов с данными

Приятные функции:

  • Числа предоставляются параллельным кольтом
  • Диаграммы генерируются с использованием очень полной библиотеки JFreeChart
  • Также используется Обработка для некоторых визуализаций
  • Сам по себе Clojure - отличный язык для обработки и исследования данных
  • Взаимодействие с Java превосходно, поэтому вы можете легко использовать любые библиотеки Java (для таких вещей, как доступ к базе данных,веб-сервисы, интеграция очереди сообщений, сетевое взаимодействие и т. д.)

Мне особенно нравится DSL для создания диаграмм, например, для создания гистограммы из 1000 выборок из обычного распределения, которое вы можете просто сделать:

(view (histogram (sample-normal 1000)))
1 голос
/ 12 апреля 2017

Я думаю, что Incanter Clojure библиотека для статистики и визуализации данных.clojure является функциональным и превосходным в обработке данных и аналитике

0 голосов
/ 03 января 2018

Я лично начал использовать Python + D3.js .

Python - отличная технология для работы с данными - для управления, преобразования и вывода в различных форматах.

И D3.js - отличная библиотека для визуализации данных.Это намного проще, чем кажется на первый взгляд.Есть много примеров в Интернете для начала.И самое приятное то, что вы можете создавать интерактивные диаграммы, которые позволяют вам представлять различные представления или разные уровни данных во время детализации.

0 голосов
/ 03 января 2018

R язык в основном используется для науки о данных - вы можете выполнять сложные математические манипуляции с данными и строить прогностические модели, но он не поможет вам ни с его удобством, ни с простой графикой. Я не думаю, что вам нужна Java, если у вас не будет сложной бизнес-логики или многопоточности.

Поэтому я бы порекомендовал придерживаться Python - он действительно удобен для обработки данных, прост в освоении. На самом деле, работа с данными является сильной стороной Python. Вы также можете выбрать библиотеки визуализации данных множественные (ссылка является хорошей компиляцией, нашел ее в Интернете) или попробовать javascript сверху. Не бойся и удачи!

0 голосов
/ 16 июля 2011

Python, Octave, C / C ++ и так далее. Для каждого из них существует множество библиотек для построения графиков.

Я могу порекомендовать библиотеку графики GPL MathGL и ее интерфейс UDAV . У последнего есть другой командный язык для печати. ​​

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...