matplotlib: установка метки тика на линейчатом графике для диапазона цен - PullRequest
0 голосов
/ 15 марта 2019

имеют исходные ячейки на графике = массив ([0, 2500, 5000, 7500, 10000, 12500, 15000, 17500, 20000, 22500, 25000, 27500, 30000, 32500, 35000, 37500, 40000, 42500, 45000, 47500, 50000, 52500, 55000, 57500, 60000, 62500, 65000, 67500, 70000, 72500, 75000, 77500, 80000, 82500, 85000, 87500, 90000, 92500, 95000, 97500, 100000, 102500], dtype = int64)

выглядит как enter image description here

хотел бы, чтобы метка x tick отображалась в диапазоне и в ценовом формате (например, $ 0- $ 2500 , $ 2500- $ 50,000 и т. Д.). Примерно так, как показано ниже, но со знаком $ перед каждым числом enter image description here

Спасибо!

Ответы [ 2 ]

1 голос
/ 16 марта 2019

Вы можете использовать панды cut ( документ ) и numpy's linspace (или что-нибудь эквивалентное), должна быть возможность генерировать оба интервала bin (n bin) и соответствующие имярлыки бункеров (n-1).Вы можете использовать знак $, чтобы обогатить эти метки.См. Также Пометка гистограммы по бинам matplotlib

Адаптированный пример с использованием seaborn:

enter image description here

# coding=utf-8
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = np.random.normal(5000, 1000, 1000)

dataframe = pd.DataFrame(data)
dataframe = dataframe.rename({0 : 'values'}, axis='columns')
print(dataframe.head(3))
print('---------------')
cut_vals = np.linspace(start=dataframe['values'].min(),stop=dataframe['values'].max(),num=8)
bin_headers = list()

for index in range(len(cut_vals) - 1):
    header = '$ {}-{}'.format(int(cut_vals[index]), int(cut_vals[index+1]))
    bin_headers.append(header)

print(bin_headers)

print('---------------')
dataframe['categories'] = pd.cut(dataframe['values'], cut_vals, labels=bin_headers)

print('---------------')
print(dataframe.head(2))

ind = np.array(cut_vals[:-1])
width = np.array([cut_vals[i+1]-cut_vals[i] for i in range(len(cut_vals)-1)])

g = sns.distplot(dataframe['values'], bins=cut_vals, label='foo')
g.set_xticks(ind + width/2)
g.set_xticklabels(bin_headers, rotation=45)
plt.show()

Вывод:

        values
0  4442.338053
1  5253.443608
2  6552.700087
---------------
['$ 2080-3034', '$ 3034-3988', '$ 3988-4942', '$ 4942-5897', '$ 5897-6851', '$ 6851-7805', '$ 7805-8759']
---------------
---------------
        values   categories
0  4442.338053  $ 3988-4942
1  5253.443608  $ 4942-5897
1 голос
/ 16 марта 2019

вижу разницу от дупе. Я хотел бы предложить обходное решение, используя образцы данных, поскольку вы не предоставили MCVE

import numpy as np
import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.hist(np.random.normal(50000, 10000, 100000), bins=bins)
ax.set_xlim(0, 100000)

fig.canvas.draw()
labels = [i.get_text().strip('$') for i in ax.get_xticklabels()]
new_labels = [('\${:,}' + 'to' +  '\${:,}').format(int(i), int(j)) 
              for i, j in zip(labels[0:-1],labels[1:])]

ax.set_xticklabels(new_labels, rotation=45)
plt.show()

enter image description here

...