Здесь много контекста, который можно найти в документации pandas к фрейму данных .
Для начала df
- это объект класса pandas.DataFrame
. pandas.DataFrame
имеет функцию с именем groupby
, которая требует некоторого ввода. В вашем примере ввод 'Age'
. Когда вы передаете аргументы функции, она выглядит следующим образом:
my_function(input)
, когда у вас есть более одного ввода, общий способ их передачи - это несколько переменных, например
my_function(input1, input2, etc, ...)
pandas.DataFrame.groupby(...)
возвращает объект, который подписан или может быть вырезан . Использование обозначения слайса похоже на доступ к элементу в list
или dict
, например
my_list = [1,2,3]
print(my_list[0]) # --> 1
my_dict = {
"a": "apple",
"b": "banana",
"c": "cucumber"
}
print(my_dict["b"]) # --> banana
, возвращаясь к вашему конкретному c вопросу:
df.groupby('Age')['Salary'].mean()
df # df, the name of your DataFrame variable
.groupby('Age') # call the function groupby to get the frame grouped by the column 'Age'
['Salary'] # access the 'Salary' element from that groupby
.mean() # and apply the mean() function to the 'Salary' element
Итак Похоже, что вы получаете список всех средних зарплат по возрасту работника. Надеюсь, это поможет объяснить