То, что я хочу, примерно эквивалентно
df.where(<condition>).count() != 0
Но я почти уверен, что он не достаточно умен, чтобы остановиться, когда обнаружит любое такое нарушение. Я ожидаю, что какой-нибудь агрегатор сможет это сделать, но я не нашел такого? Я мог бы сделать это с max
и каким-то преобразованием, но, опять же, я не думаю, что он обязательно узнает, что нужно выйти (не указав c для bool, я не уверен, понимает ли, что значение не больше, чем true).
Более конкретно, я хочу проверить, содержит ли столбец только один элемент. Сейчас моя лучшая идея - сделать это, взяв первое значение и сравнив все.