У меня большой массив данных со многими столбцами, но я рассматриваю только один столбец.
Этот пример для простоты.Я определил новый столбец col2, в котором будет храниться логическое значение, если будут выполнены условия первого столбца.
raw_data = { 'col1': [[0, 2, 3, 4],[6, 7, 1000, 40, 20],[4, 20, 100]]}
df = pd.DataFrame(raw_data, columns = ['col1'])
df
df['col2'] = 'default'
df
col1 col2
row1 [2,3,44,89.6,...] default
row2 [10,4,33.3,1.11,...] default
Мне нужно выполнить некоторые вычисления для столбца col1 и, если выполняются некоторые условия, по умолчаниюв столбце col2 в той же строке устанавливается значение True, в противном случае - значение False.
Упрощенные вычисления
Рассчитать максимальное значение в списке, длину списка и среднее значение.
Я выполняю эти вычисления в функции, а затем ввожу другую функцию, которая пытается выполнить часть оценки.
Например, если максимальное значение> 10 и длина списка равна> 5 и если среднее значение> 25, установите значение по умолчанию в col2 равным True.
Я считаю, что мне нужно использовать функцию .apply ().
df['col2'] = df.apply (lambda row: my_functions (row),axis=1)
Требуемый вывод
col1 col2
row1 [2,3,44,89.6,...] True
row2 [10,4,33.3,1.11,...] False
Я застрял здесь, поскольку не знаю, как выполнять некоторые вычисления, выполнять итерацию по всему столбцу и оценивать эти вычисления.
Спасибо!