Возможно, вы захотите использовать логическое нарезание.
is_music = df['category_name'] == 'Music'
new_df = df[is_music]
Это работает, потому что is_music
является логическим массивом, который указывает, равен ли столбец category_name
строки Music
. В приведенном выше примере с тремя строками is_music
будет выглядеть примерно так:
>>> is_music
0 False
1 True
2 False
Затем мы можем использовать эту информацию, чтобы выбрать только те строки фрейма данных, где is_music
равно True
, Это то, чего достигает вторая строка кода. Конечно, вы могли бы просто написать все это в одной строке:
new_df = df[df['category_name'] == 'Music']