У меня есть такой набор данных:
x = {'column1': ['a','a','b','b','b','c','c','c','d'],
'column2': [1,0,1,1,0,1,1,0,1]
}
df = pd.DataFrame(x, columns = ['column1', 'column2'])
print (df)
Как мне извлечь данные только из второго столбца, который имеет значение один (как это):
x = {'column1': ['a','b','b','c','c','d'],
'column2': [1,1,1,1,1,1]
}
df = pd.DataFrame(x, columns = ['column1', 'column2'])
print (df)
Также как я посчитал бы число единиц для каждого значения в столбце 1 и создал бы новый столбец и вставил бы эту информацию для соответствующих индексов в coulmn_1 (например, сколько единиц имеют индексное значение a в column_1?). Таким образом, он превращает фрейм данных в этот формат:
x = {'column1': ['a','b','b','c','c','d'],
'column2': [1,1,1,1,1,1],
'column3': [1,2,2,2,2,1]
}
df = pd.DataFrame(x, columns = ['column1', 'column2','column3'])
print (df)