В настоящее время я делаю анализ, чтобы выполнить следующее:
1. Мне нужно рассчитать, существует ли 4 записи в год для 'Нет. Люди на 2018 и 2019 годы. Одни и те же даты следует исключить (неважно, какая)
Это должно выглядеть следующим образом:
Year Gender No. People
18 Men 11
Woman 8
Not Applied 3
19 Men 14
Woman 5
Not Applied 0
Столбец № Люди показывает количество № людей.
2. Проверьте по полу, существует ли за последние 10 месяцев за 10-дневный период более 6 записей в № людей.
Результат может выглядеть следующим образом:
Period Gender Entries
01/23/2019 - 01/15/2019 Men 6
N/A Woman N/A
N/A Not Applied N/A
3. Проверьте, есть ли 11 показателей для числа людей за последние 3 месяца
Period Gender Entries
12/20/2018 - 01/23/2019 Men 26
12/20/2018 - 01/23/2019 Woman 13
12/20/2018 - 12/26/2018 Not Applied N/A
Каким-то образом это выглядит усложненным, и поэтому я борюсь с кодом.
Я начал использовать следующий код:
import pandas as pd
path = 'path'
filename = 'excel.xls'
final_path = path + '/' + filename
ws_name = 'Sheet1'
df.groupby(df['Date'].dt.year)['No. People'].agg(['count'])
, но, так или иначе, я борюсь с результатами или ошибками.
Данные в Excel выглядят следующим образом:
Date Gender No. People
12/20/18 Men 4
12/21/18 Men 9
12/22/18 Men 3
12/23/18 Men 9
12/24/18 Men 6
12/25/18 Men 1
12/26/18 Men 3
12/27/18 Men 8
12/28/18 Men 3
12/29/18 Men 5
12/30/18 Men 8
12/31/18 Men
01/01/19 Men
01/02/19 Men
01/03/19 Men
01/04/19 Men 9
01/05/19 Men 7
01/06/19 Men 5
01/07/19 Men 1
01/08/19 Men 8
01/09/19 Men 5
01/10/19 Men 6
01/11/19 Men 9
01/12/19 Men 7
01/13/19 Men
01/14/19 Men
01/15/19 Men
01/16/19 Men
01/17/19 Men
01/18/19 Men
01/19/19 Men 6
01/20/19 Men 5
01/21/19 Men 2
01/22/19 Men 5
01/23/19 Men 1
12/20/18 Women 6
12/21/18 Women 6
12/22/18 Women 2
12/23/18 Women 2
12/24/18 Women 2
12/25/18 Women
12/26/18 Women
12/27/18 Women
12/28/18 Women 1
12/29/18 Women 1
12/30/18 Women 4
12/31/18 Women
01/01/19 Women
01/02/19 Women
01/03/19 Women
01/04/19 Women
01/05/19 Women
01/06/19 Women
01/07/19 Women
01/08/19 Women
01/09/19 Women
01/10/19 Women
01/11/19 Women
01/12/19 Women
01/13/19 Women
01/14/19 Women
01/15/19 Women
01/16/19 Women
01/17/19 Women
01/18/19 Women
01/19/19 Women 4
01/20/19 Women 6
01/21/19 Women 8
01/22/19 Women 9
01/23/19 Women 4
12/20/18 Not Applied 6
12/21/18 Not Applied 2
12/22/18 Not Applied 3
12/23/18 Not Applied
12/24/18 Not Applied
12/25/18 Not Applied
12/26/18 Not Applied