Я хочу преобразовать pandas dataframe в массив numpy с групповой меткой.В groupby я должен группировать с помощью регулярных выражений, поэтому важно взять с собой ярлык.
Мои данные в формате:
start_date,is_member
2014-04-15 00:01,1
2014-04-15 00:01,1
2014-04-15 01:01,1
2014-04-15 01:01,1
2014-04-15 02:02,1
2014-04-15 03:05,1
Я пробовал
df = pd.read_csv(filename, header=0)
df = df.groupby(df.start_date.str.extract("^(.*?)\:", expand=False))[['start_date']].count()[['start_date']]
print(df)
Вывод Dataframe:
start_date
2014-04-15 00 2
2014-04-15 01 2
2014-04-15 02 1
2014-04-15 03 1
Я пыталсяпреобразовать его в массив numy с помощью
numpy_array = df.values
Вывод массива numpy - это просто значение счетчика
[[2]
[2]
[1]
[1]]
Я хочу, чтобы начальная дата в виде столбца.
[[2014-04-15 00 2]
[2014-04-15 01 2]
[2014-04-15 02 1]
[2014-04-15 03 1]]