Точно, почему мои пузыри все одного цвета? - PullRequest
0 голосов
/ 10 апреля 2020

В моих данных есть столбец «Магазины пиццы», в котором есть номера по штатам, от 10 000 до более миллиона (цифры составлены). По какой-то причине каждый пузырь, хотя и имеет правильный размер, все отображается одинаковым цветом (красным).

Мой код

import plotly.graph_objects as go
import pandas as pd
import os

xl_path = "path to XLSX file"

df = pd.read_excel(open(xl_path, 'rb'), sheet_name='Data')
df.head()
scale = 5000
limits = [(0,15000),(15000,50000),(50000,100000),(100000,500000),(500000,2000000)]
colors = ["red","orange","yellow","green","blue"]
df['Text'] = df['State'] + '<br>Number of Pizza Shops ' + (df['Pizza Shops']).astype(str)

fig = go.Figure()

for i in range(len(limits)):
    lim = limits[i]
    df_sub = df[lim[0]:lim[1]]
    fig.add_trace(go.Scattergeo(
        locationmode = 'USA-states',
        locations=df['State Code'],
        text = df_sub['Text'],
        marker = dict(
            size = df_sub['Pizza Shops']/scale,
            color = colors[i],
            line_color='rgb(40,40,40)',
            line_width=0.5,
            sizemode = 'area'
        ),
        name = '{0} - {1}'.format(lim[0],lim[1])))

fig.update_layout(
        title_text = '2019 US Number of Pizza Shops<br>(Click legend to toggle traces)',
        showlegend = True,
        geo = dict(
            scope = 'usa',
            landcolor = 'rgb(217, 217, 217)',
        )
    )

fig.show()

Пример данных:

| State     | State Code | Pizza Shops |
----------------------------------------
  Texas           TX         13256
  California      CA         500235
  Idaho           ID         4000
  ....           ....        .... and so on

1 Ответ

0 голосов
/ 13 апреля 2020

Проблема в том, что с df_sub = df[lim[0]:lim[1]] вы поднастраиваете свой фрейм данных, основываясь на индексах строк, а не на количестве магазинов. Если ваш фрейм данных содержит менее 15 000 строк, то все точки данных будут находиться в первом сегменте и будут окрашены в красный цвет.

Если вы хотите поднастроить свой фрейм данных в зависимости от количества магазинов, вы должны заменить df_sub = df[lim[0]:lim[1]] на df_sub = df[(df["Pizza Shops"] >= lim[0]) & (df["Pizza Shops"] < lim[1])].

import plotly.graph_objects as go
import pandas as pd

df = pd.DataFrame({"State": ["Texas", "California", "Idaho", "Alabama", "Arizona", "Georgia", "Washington"],
                   "State Code": ["TX", "CA", "ID", "AL", "AZ", "GA", "WA"],
                   "Pizza Shops": [12500, 25000, 75000, 250000, 1000000, 15000, 100000]})

df["Text"] = df["State"] + "<br>Number of Pizza Shops " + (df["Pizza Shops"]).astype(str)

scale = 2000

limits = [(0,15000),(15000,50000),(50000,100000),(100000,500000),(500000,2000000)]

colors = ["red", "orange", "yellow", "green", "blue"]

fig = go.Figure()

for i in range(len(limits)):

    lim = limits[i]

    df_sub = df[(df["Pizza Shops"] >= lim[0]) & (df["Pizza Shops"] < lim[1])]

    fig.add_trace(go.Scattergeo(
        locationmode="USA-states",
        locations=df_sub["State Code"],
        text=df_sub["Text"],
        marker=dict(
            size=df_sub["Pizza Shops"]/scale,
            color=colors[i],
            line_color="rgb(40,40,40)",
            line_width=0.5,
            sizemode="area"),
        name="{0} - {1}".format(lim[0],lim[1])))

fig.update_layout(
    title_text="2019 US Number of Pizza Shops<br>(Click legend to toggle traces)",
    showlegend=True,
    geo=dict(scope="usa", landcolor="rgb(217, 217, 217)")
)

fig.show()

enter image description here

...