Советы по типу для pandas DatafFrame со смешанными типами - PullRequest
1 голос
/ 23 апреля 2020

Я искал надежные подсказки типа для pandas DataFrame, но не могу найти ничего полезного. Этот вопрос едва затрагивает поверхностные Pythoni c подсказки типа с pandas?

Обычно, если я хочу намекнуть тип функции, которая имеет DataFrame в качестве входного аргумента I будет делать:

import pandas as pd 
def func(arg: pd.DataFrame) -> int: 
     return 1

То, что я не могу найти, это то, как я могу набрать подсказку DataFrame с смешанных dtypes . Конструктор DataFrame поддерживает только определение типа полного DataFrame. Так что, насколько мне известно, изменения в dtypes могут произойти только с помощью функции pd.DataFrame().astype(dtypes={}).

Это работает, но мне не кажется, что pythoni c

import datetime
def func(arg: pd.DataFrame(columns=['integer', 'date']).astype(dtype={'integer': int, 'date': datetime.date})) -> int:
    return 1

Я встречал этот пакет: https://pypi.org/project/dataenforce/ с примерами, такими как вот этот:

def process_data(data: Dataset["id": int, "name": object, "latitude": float, "longitude": float])
  pass

Это выглядит несколько многообещающе, но, к сожалению, проект старый и глючный.

Как специалист по данным, создавая приложение машинного обучения с длинными процессами ETL, я считаю, что подсказки типов важны.

Что вы используете, и кто-нибудь печатает намеки на свои кадры данных в pandas?

...