Я искал надежные подсказки типа для pandas DataFrame, но не могу найти ничего полезного. Этот вопрос едва затрагивает поверхностные Pythoni c подсказки типа с pandas?
Обычно, если я хочу намекнуть тип функции, которая имеет DataFrame в качестве входного аргумента I будет делать:
import pandas as pd
def func(arg: pd.DataFrame) -> int:
return 1
То, что я не могу найти, это то, как я могу набрать подсказку DataFrame с смешанных dtypes . Конструктор DataFrame поддерживает только определение типа полного DataFrame. Так что, насколько мне известно, изменения в dtypes могут произойти только с помощью функции pd.DataFrame().astype(dtypes={})
.
Это работает, но мне не кажется, что pythoni c
import datetime
def func(arg: pd.DataFrame(columns=['integer', 'date']).astype(dtype={'integer': int, 'date': datetime.date})) -> int:
return 1
Я встречал этот пакет: https://pypi.org/project/dataenforce/ с примерами, такими как вот этот:
def process_data(data: Dataset["id": int, "name": object, "latitude": float, "longitude": float])
pass
Это выглядит несколько многообещающе, но, к сожалению, проект старый и глючный.
Как специалист по данным, создавая приложение машинного обучения с длинными процессами ETL, я считаю, что подсказки типов важны.
Что вы используете, и кто-нибудь печатает намеки на свои кадры данных в pandas?