Я новичок в pandas
, но пытаюсь изучить его, но я должен создать функцию для этого с помощью библиотеки. У меня есть CSV-файл source.csv
с фиктивными данными (ссылка на файл: pastebin ). Ключевые столбцы в нем: month, area, name, errors
. Для каждого месяца, начиная с MY WORKS
в area
, следует фильтровать нижнее значение works
(?). Для каждой работы необходимо учитывать количество вопросов в столбце errors
. Если ошибок нет, следует принять во внимание 0.
import pandas as pd
source_df = pd.read_csv('source.csv') # Sorry guys, don't know how to proceed from here
works = ['WORLD', 'P&G', 'PART D', 'BRIGHTS', 'NOTIFICATION',
'OOP', 'ABCD', 'CHANNEL', 'KENNY DISPLAY', 'Migration']
months = ['January', 'March', 'April', 'May', 'June']
# Expected output:
data = {'WORLD': {'categories': months,
'series': [{
'name': 'Big Issue',
'data': [0, 0, 0, 0, 0] # Number of Big Issues in those months
}, {
'name': 'Small Issue',
'data': [1, 0, 0, 0, 0] # Number of Small Issues in those months
}, {
'name': 'Monitoring',
'data': [0, 2, 0, 0, 0] # Number of Monitorings in those months
}, {
'name': 'Improvement',
'data': [0, 0, 0, 1, 0] # Number of Improvements in those months
}]
},
'P&G': {'categories': months,
'series': [{
'name': 'Big Issue',
'data': [0, 0, 0, 0, 0]
}, {
'name': 'Small Issue',
'data': [0, 0, 0, 1, 0]
}, {
'name': 'Monitoring',
'data': [0, 2, 0, 0, 0]
}, {
'name': 'Improvement',
'data': [0, 0, 0, 1, 0]
}]
}
}
Вывод словаря будет завершен с остальными элементами в works
. Ожидаемый результат, показанный выше, предназначен только для WORLD
и P&G
.