Скажем, у нас есть список уникальных категорий в кадре данных df2:
categories = df2['Category'].unique()
Я хочу провести l oop через каждую категорию в df2, сопоставить ее с переменными категориями выше и применить лямбда-функцию , Какой будет синтаксис?
Я пробовал следующее:
df2.loc[df2.Category == categories, :].apply(lambda x: x.sample(n=3) if
x.size*0.01 < 3 else x.sample(frac=0.01))
предположительно, приведенный выше код должен проходить через каждую категорию в категориях и возвращать все элементы в этой категории, верно? Или я что-то упустил? Я получаю следующую ошибку:
ValueError: Lengths must match to compare.
Я получаю ошибку, я думаю, потому, что df.Category длиннее категорий, потому что df.Category - это список всех категорий, которые являются дубликатами. Вот почему я попробовал .unique (). Есть ли способ исправить эту проблему, чтобы мой код работал? Спасибо за ваше время.