Question

У меня есть функция, которая возвращает имена столбцов pandas dataframe, которые имеют ряд уникальных значений <= 100: </p>

cols_unique = list(df[cols].loc[:, df[cols].apply(lambda x: x.nunique()) <= 100])

Я хотел бы изменить это, чтобы возвращать имена столбцов, в которыхчисло уникальных значений составляет <= 50% от общего количества значений, моя попытка: </p>

cols_unique = list(df[cols].loc[:, df[cols].apply(lambda x: x.nunique() <= x.count()/2]))

Но это не работает.

Как сделать сравнение в лямбда-выражениифункционировать?

Chris A · Answer 1 · 17 декабря 2018

IIUC вы можете попробовать:

cols_unique = list(df[cols].loc[:, df[cols].apply(lambda x: x.nunique() <= len(df) / 2)])

Если вы открыты для альтернативы, которая не использует функцию lambda, вы можете попробовать:

 list(cols[df[cols].nunique().le(len(df) // 2)])

панды, сравнение в лямбде

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

панды, сравнение в лямбде

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов