Итак, у меня есть несколько файлов данных .csv, которые я должен очистить.Пример одной из строк данных:
u[i] = {'age': '44', 'salary': '117681.0', 'suburb': None, 'language': 'English'}
Я отфильтровал данные, которые мне не нужны, и возвратил несколько строк соответствующих словарей.например:
{'age': '44', 'salary': '117681.0', 'suburb': None}
{'age': '34', 'salary': '56456.0', 'suburb': 'Frankston'}
{'age': '37', 'salary': '59370.0', 'suburb': 'Richmond'}
{'age': '44', 'salary': '91399.0', 'suburb': 'Collingwood'}
{'age': '36', 'salary': '74437.0', 'suburb': 'Toorak'}
{'age': '41', 'salary': '89121.0', 'suburb': 'Frankston'}
Теперь я хочу суммировать зарплату в каждом из этих словарей, чтобы найти среднюю зарплату, но я не могу понять это за свою жизнь.
Я пытался выделить только значения зарплаты и использовать счетчики, но, похоже, я не могу заставить это работать.Я также попытался создать списки, через которые я могу проходить, но я не могу получить все значения в одном списке.Проблема для меня заключается в том, что когда я изолирую значения, они представляют собой параллельные значения / списки, и я не знаю, как с этим работать.
Буду очень признателен за любую помощь, это сводит меня с ума!Спасибо!
Вот мой код, но на данный момент у меня нет ничего заслуживающего внимания:
def average_salary(data, lower_age, upper_age):
u = dict(sorted(data_cleaned.items()))
count = 0
for i in u:
age = u[i]['age']
sal = u[i]['salary']
tally = 0
if age is not None and sal is not None and lower_age < float(age) < upper_age:
tally += float(u[i]['salary'])
print(u[i]['salary'])