Question

Я знаю, как создать гистограмму (просто используйте «с полями») в gnuplot, если мой файл .dat уже содержит правильно сформированные данные. Есть ли способ взять список чисел и сделать так, чтобы gnuplot предоставил гистограмму, основанную на диапазонах и размерах бина, которые предоставляет пользователь?

Born2Smile · Answer 1 · 29 марта 2010

да, и это быстро и просто, хотя и очень скрыто:

binwidth=5
bin(x,width)=width*floor(x/width)

plot 'datafile' using (bin($1,binwidth)):(1.0) smooth freq with boxes

Изучите help smooth freq, чтобы понять, почему вышеизложенное делает гистограмму

для работы с диапазонами просто установите переменную xrange.

mas90 · Answer 2 · 29 августа 2010

У меня есть пара исправлений / дополнений к очень полезному ответу Born2Smile:

Пустые контейнеры привели к тому, что ящик для соседнего контейнера неправильно выдвинулся в его пространство; избегайте этого, используя set boxwidth binwidth
В версии Born2Smile ячейки отображаются в центре по их нижней границе. Строго они должны простираться от нижней границы до верхней границы. Это можно исправить, изменив функцию bin: bin(x,width)=width*floor(x/width) + width/2.0

ChrisW · Answer 3 · 25 октября 2013

Будьте очень осторожны: все ответы на этой странице неявно принимают решение о том, где начинается биннинг - левый край самого левого бина, если хотите - из рук пользователя. Если пользователь комбинирует любую из этих функций для объединения данных со своим собственным решением о том, где начинается объединение (как это делается в блоге, на который есть ссылка выше), все вышеперечисленные функции неверны. С произвольной начальной точкой для биннинга «Мин» правильная функция:

bin(x) = width*(floor((x-Min)/width)+0.5) + Min

Вы можете видеть, почему это правильно последовательно (это помогает нарисовать несколько ячеек и точку где-то в одном из них). Вычтите Min из вашей точки данных, чтобы увидеть, как далеко он находится в диапазоне биннинга. Затем разделите на ширину бина, чтобы вы эффективно работали в единицах «бинов». Затем «пол» результата, чтобы перейти к левому краю этой корзины, добавьте 0,5, чтобы перейти к середине корзины, умножьте на ширину, чтобы вы больше не работали в единицах корзин, а в абсолютном масштабе затем снова добавьте минимальное смещение, которое вы вычли в начале.

Рассмотрим эту функцию в действии:

Min = 0.25 # where binning starts
Max = 2.25 # where binning ends
n = 2 # the number of bins
width = (Max-Min)/n # binwidth; evaluates to 1.0
bin(x) = width*(floor((x-Min)/width)+0.5) + Min

например. значение 1.1 действительно попадает в левую корзину:

эта функция правильно отображает его в центре левого бункера (0,75);
Ответ Born2Smile, bin (x) = width * floor (x / width), неправильно отображает его в 1;
ответ mas90, bin (x) = ширина * floor (x / width) + binwidth / 2.0, неправильно отображает его на 1,5.

Ответ Born2Smile верен только в том случае, если границы бина появляются при (n + 0,5) * ширине бина (где n пробегает целые числа). Ответ mas90 верен только в том случае, если границы бина появляются при n * binwidth.

hsxz · Answer 4 · 17 сентября 2011

Хотите построить график, подобный этому? enter image description here да? Тогда вы можете посмотреть мою статью в блоге: http://gnuplot -surprising.blogspot.com / 2011/09 / statistics-analysis-and-histogram.html

Ключевые строки из кода:

n=100 #number of intervals
max=3. #max value
min=-3. #min value
width=(max-min)/n #interval width
#function used to map a value to the intervals
hist(x,width)=width*floor(x/width)+width/2.0
set boxwidth width*0.9
set style fill solid 0.5 # fill style

#count and plot
plot "data.dat" u (hist($1,width)):(1.0) smooth freq w boxes lc rgb"green" notitle

Dai · Answer 5 · 25 июня 2014

Как обычно, Gnuplot - это фантастический инструмент для построения привлекательных графиков, который можно использовать для выполнения всевозможных вычислений. Однако , он предназначен для отображения данных, а не в качестве калькулятора, и часто проще использовать внешнюю программу (например, Octave) для выполнения более «сложных» вычислений, сохраняя эти данные в файле , затем используйте Gnuplot для создания графика. Для вышеупомянутой проблемы, проверьте, что «историческая» функция - Октава, используя [freq,bins]=hist(data), затем поместите это в Gnuplot, используя

set style histogram rowstacked gap 0
set style fill solid 0.5 border lt -1
plot "./data.dat" smooth freq with boxes

Alex · Answer 6 · 27 марта 2012

Я считаю эту дискуссию чрезвычайно полезной, но у меня возникли некоторые проблемы с округлением.

Точнее говоря, используя ширину бина 0,05, я заметил, что с методами, представленными здесь выше, точки данных, которые читают 0,1 и 0,15, попадают в тот же бин. Это (явно нежелательное поведение), скорее всего, связано с функцией «floor».

Здесь и далее мой небольшой вклад, чтобы попытаться обойти это.

bin(x,width,n)=x<=n*width? width*(n-1) + 0.5*binwidth:bin(x,width,n+1)
binwidth = 0.05
set boxwidth binwidth
plot "data.dat" u (bin($1,binwidth,1)):(1.0) smooth freq with boxes

Этот рекурсивный метод для х> = 0; можно обобщить это с помощью более условных утверждений, чтобы получить что-то еще более общее.

JOE · Answer 7 · 17 ноября 2012

Нам не нужно использовать рекурсивный метод, он может быть медленным. Мое решение - использовать пользовательскую функцию rint вместо встроенной функции int или floor.

rint(x)=(x-int(x)>0.9999)?int(x)+1:int(x)

Эта функция выдаст rint(0.0003/0.0001)=3, а int(0.0003/0.0001)=floor(0.0003/0.0001)=2.

Почему? Пожалуйста, посмотрите на Функция Perl int и нули дополнения

path4 · Answer 8 · 02 декабря 2013

У меня есть небольшая модификация решения Born2Smile.

Я знаю, что это не имеет особого смысла, но вы можете захотеть это на всякий случай. Если ваши данные целочисленные и вам нужен размер ячейки с плавающей запятой (может быть, для сравнения с другим набором данных или плотностью графика в более мелкой сетке), вам нужно будет добавить случайное число между 0 и 1 внутри пола. В противном случае возникнут пики из-за ошибки округления. floor(x/width+0.5) не подойдет, потому что создаст шаблон, который не соответствует исходным данным.

binwidth=0.3
bin(x,width)=width*floor(x/width+rand(0))

Winston Smith · Answer 9 · 24 июля 2014

Что касается функций биннинга, я не ожидал результата функций, предложенных до сих пор. А именно, если моя ширина ячейки равна 0,001, эти функции центрировали ячейки на 0,0005 точек, тогда как я чувствую, что более интуитивно понятно, что ячейки центрированы на границах 0,001.

Другими словами, я бы хотел иметь

Bin 0.001 contain data from 0.0005 to 0.0014
Bin 0.002 contain data from 0.0015 to 0.0024
...

Я выбрал функцию биннинга

my_bin(x,width)     = width*(floor(x/width+0.5))

Вот скрипт для сравнения некоторых предлагаемых функций bin с этой:

rint(x) = (x-int(x)>0.9999)?int(x)+1:int(x)
bin(x,width)        = width*rint(x/width) + width/2.0
binc(x,width)       = width*(int(x/width)+0.5)
mitar_bin(x,width)  = width*floor(x/width) + width/2.0
my_bin(x,width)     = width*(floor(x/width+0.5))

binwidth = 0.001

data_list = "-0.1386 -0.1383 -0.1375 -0.0015 -0.0005 0.0005 0.0015 0.1375 0.1383 0.1386"

my_line = sprintf("%7s  %7s  %7s  %7s  %7s","data","bin()","binc()","mitar()","my_bin()")
print my_line
do for [i in data_list] {
    iN = i + 0
    my_line = sprintf("%+.4f  %+.4f  %+.4f  %+.4f  %+.4f",iN,bin(iN,binwidth),binc(iN,binwidth),mitar_bin(iN,binwidth),my_bin(iN,binwidth))
    print my_line
}

и вот вывод

   data    bin()   binc()  mitar()  my_bin()
-0.1386  -0.1375  -0.1375  -0.1385  -0.1390
-0.1383  -0.1375  -0.1375  -0.1385  -0.1380
-0.1375  -0.1365  -0.1365  -0.1375  -0.1380
-0.0015  -0.0005  -0.0005  -0.0015  -0.0010
-0.0005  +0.0005  +0.0005  -0.0005  +0.0000
+0.0005  +0.0005  +0.0005  +0.0005  +0.0010
+0.0015  +0.0015  +0.0015  +0.0015  +0.0020
+0.1375  +0.1375  +0.1375  +0.1375  +0.1380
+0.1383  +0.1385  +0.1385  +0.1385  +0.1380
+0.1386  +0.1385  +0.1385  +0.1385  +0.1390

Гистограмма с использованием gnuplot?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Гистограмма с использованием gnuplot?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы