Напористое программирование с пандами - PullRequest
0 голосов
/ 13 декабря 2018

Я ищу способ сделать напористое программирование на данных панелей данных pandas так же, как assertr в R.

Есть ли какая-нибудь удобная библиотека для этого?Все советы очень приветствуются.

Ответы [ 2 ]

0 голосов
/ 04 февраля 2019

Я нашел ответ на свой вопрос: engarde именно то, что я искал.

0 голосов
/ 14 декабря 2018

Я не знаю аналогичных библиотек, которые специально интегрируются с Pandas, но assert - это встроенное ключевое слово в Python, которое вы можете использовать для проверки данных в различных точках вашего конвейера данных..

Синтаксис просто:

assert [condition]

Если true, ничего не происходит.Если false, AssertionError повышается.

Чтобы проверить данные Панд, вы могли бы написать следующее утверждение:

import pandas as pd
import seaborn as sns

iris = sns.load_dataset('iris')

# throws an exception if there are negative values in the sepal_length column
assert (iris['sepal_length'] > 0).all()
...