Полноценная интерпретация линейной регрессии (нелинейных данных) - PullRequest
0 голосов
/ 30 апреля 2020

Создал точечный график с помощью графика и вставил линию наилучшего соответствия. Мой вопрос в основном связан с интерпретацией сюжета. Мои данные не очень линейны. Могу ли я применить к нему лучшую линию плоттеров? Если нет, то есть ли у него другие варианты? Или я должен избегать использования линии тренда с учетом данных.

    x= 'Average HPD Violations Per Household'
    fig = px.scatter(trans, x=new_df[x], y=new_df['Rate'], color="City",
                     hover_name='Zip Code', hover_data=[x, 'COVID-19 Rate Per 10,000 People','Total Population' ])


    fig.update_layout(
        title="Chart Title",
        xaxis_title=x,
        yaxis_title='Rate',
        font=dict(
            family="Tw Cen MT, monospace",
            size=14,
            color="#333333"
        )
    )


    fig.update_layout(
        title={
            'y':0.95,
            'x':0.5,
            'xanchor': 'center',
            'yanchor': 'top'})




    regline = sm.OLS(new_df['Rate'],sm.add_constant(new_df[x])).fit().fittedvalues

    fig.add_traces(go.Scatter(x=new_df[x], y=regline,
                              mode = 'lines',
                              marker_color='black',
                              name='Trend Line')


          )


fig.show()

enter image description here

...