Показать pandas Dataframe на веб-странице и динамически фильтровать с помощью Dash - PullRequest
1 голос
/ 18 февраля 2020

Я пытаюсь отобразить фрейм данных с Da sh. У меня есть фрейм данных https://www.kaggle.com/timoboz/superbowl-history-1967-2020. Моя цель - показать фрейм данных на веб-странице с помощью одной кнопки поиска, которая динамически ищет все столбцы и фильтрует фрейм данных.

Пока у меня есть следующий код, который отображает фрейм данных.

import pandas as pd
import dash
import dash_table
from dash.dependencies import Input, Output
df  = pd.read_csv('./Data/superbowl.csv')
PAGE_SIZE = 10
app = dash.Dash(__name__)

app.layout = dash_table.DataTable(
    id='datatable-paging',
    columns=[
        {"name": i, "id": i} for i in df.columns #sorted(df.columns)
    ],
    page_current=0,
    page_size=PAGE_SIZE,
    page_action='custom',

    sort_action='custom',
    sort_mode='single',
    sort_by=[]
)


@app.callback(
    Output('datatable-paging', 'data'),
    [Input('datatable-paging', "page_current"),
     Input('datatable-paging', "page_size"),
     Input('datatable-paging', 'sort_by')])
def update_table(page_current,page_size,sort_by):
    if len(sort_by):
        dff = df.sort_values(
            sort_by[0]['column_id'],
            ascending=sort_by[0]['direction'] == 'asc',
            inplace=False
        )
    else:
        # No sort is applied
        dff = df

    return dff.iloc[
           page_current * page_size:(page_current + 1) * page_size
           ].to_dict('records')



if __name__ == '__main__':
    app.run_server(debug=True)

Output so far После прочтения документации https://dash.plot.ly/datatable/callbacks особенно «Бэкэнд пейджинг с фильтрацией», я не смог найти способ создать единственное текстовое поле, которое будет искать во всех столбцах и фильтровать фрейм данных для сопоставленных записей.

1 Ответ

1 голос
/ 19 февраля 2020

Лучший способ сделать это - использовать компонент ввода для вашего поискового запроса. Затем можно обновить таблицу, применив фильтр pandas. Это возвращает все строки, где любая ячейка содержит текст.

Пример обратного вызова фильтра ниже:

@app.callback(
    Output('datatable', 'data'),
    [Input('filter-input', 'value')])
def update_table(filter_string):
    dff = df[df.apply(lambda row: row.str.contains(filter_string, regex=False).any(), axis=1)]
    return dff.to_dict('records')

Ваш входной компонент ниже (обратите внимание на использование debounce - это означает, что обратный вызов будет только действовать, когда пользователь нажимает Enter):

С import dash_core_components as dcc

dcc.Input(value='', id='filter-input', placeholder='Filter', debounce=True)

Взяв ваш текущий код и собрав все это вместе:

import pandas as pd
import dash
import dash_table
import dash_core_components as dcc
import dash_html_components as html
from dash.dependencies import Input, Output

df = pd.read_csv('./Data/superbowl.csv')
PAGE_SIZE = 10
app = dash.Dash(__name__)

app.layout = html.Div([
    dcc.Input(value='', id='filter-input', placeholder='Filter', debounce=True),
    dash_table.DataTable(
        id='datatable-paging',
        columns=[
            {"name": i, "id": i} for i in df.columns  # sorted(df.columns)
        ],
        page_current=0,
        page_size=PAGE_SIZE,
        page_action='custom',

        sort_action='custom',
        sort_mode='single',
        sort_by=[]
    )
])


@app.callback(
    Output('datatable-paging', 'data'),
    [Input('datatable-paging', 'page_current'),
     Input('datatable-paging', 'page_size'),
     Input('datatable-paging', 'sort_by'),
     Input('filter-input', 'value')])
def update_table(page_current, page_size, sort_by, filter_string):
    # Filter
    dff = df[df.apply(lambda row: row.str.contains(filter_string, regex=False).any(), axis=1)]
    # Sort if necessary
    if len(sort_by):
        dff = dff.sort_values(
            sort_by[0]['column_id'],
            ascending=sort_by[0]['direction'] == 'asc',
            inplace=False
        )

    return dff.iloc[
           page_current * page_size:(page_current + 1) * page_size
           ].to_dict('records')


if __name__ == '__main__':
    app.run_server(debug=True)

Надеюсь, это поможет ,

Oll ie

...