Как я могу установить размер маркера на основе значения столбца в python, используя график рассеяния? - PullRequest
2 голосов
/ 11 апреля 2020

Привет,
Я пытаюсь использовать plotly (версия 4.6.0) для создания графиков, но возникают проблемы с атрибутом markers / size. В моем примере я использую набор цен на жилье в Бостоне. Я хочу использовать значение в одном из столбцов моего информационного кадра, чтобы установить переменный размер для маркера, но я получаю ошибку, когда использую прямую ссылку на столбец ( size = 'TAX' ) , Я могу установить размер на постоянную ( size = 1 ) без проблем. Я нашел несколько примеров в сети, но они выдают ошибку «ValueError: ...», когда я пытаюсь их использовать. Как я могу избежать этой ошибки? Код и ошибка показаны ниже.

    import chart_studio.plotly as py
    import plotly.graph_objs as go
    from plotly.offline import iplot, init_notebook_mode
    import cufflinks
    cufflinks.go_offline(connected=True)
    init_notebook_mode(connected=True)
    import pandas as pd
    from sklearn.datasets import load_boston

    boston = load_boston()
    df = pd.DataFrame(boston.data, columns=boston.feature_names)
    y = boston.target
    df['RAD_CAT']=df['RAD'].astype(str)

    df.iplot(
        x='CRIM',
        y='INDUS',
        size='TAX',
        #size=1,
        text='RAD',
        mode='markers',
        layout=dict(
            xaxis=dict(type='log', title='CRIM'),
            yaxis=dict(title='INDUS'),
            title='CRIM vs INDUS Sized by RAD'))

    ValueError:  
        Invalid value of type 'builtins.str' received for the 'size' property of scatter.marker  
            Received value: 'TAX'  

        The 'size' property is a number and may be specified as:  
          - An int or float in the interval [0, inf]  
          - A tuple, list, or one-dimensional numpy array of the above  

1 Ответ

1 голос
/ 19 апреля 2020
import chart_studio.plotly as py
import plotly.graph_objs as go
from plotly.offline import iplot, init_notebook_mode
import cufflinks

cufflinks.go_offline(connected=True)
init_notebook_mode(connected=True)
import pandas as pd
from sklearn.datasets import load_boston

boston = load_boston()
df = pd.DataFrame(boston.data, columns=boston.feature_names)

df.iplot(
    x='CRIM',
    y='INDUS',
    size=df['TAX']/20, 
    text='RAD',
    mode='markers',
    layout=dict(
        xaxis=dict(type='log', title='CRIM'),
        yaxis=dict(title='INDUS'),
        title='CRIM vs INDUS Sized by TAX'))

enter image description here

...